Recent seminars

Europe/Lisbon
SASlab (6.4.29) Faculty of Sciences of the Universidade de Lisboa — Online

Nicoleta Serban, H. Milton Stewart School of Industrial and Systems Engineering at the Georgia Institute of Technology, USA

Computational Methods for Healthcare Access Modeling

This seminar will begin with an introduction of the multidimensional construct of healthcare access, providing a well-established definition and common objectives in access measurement and inference. Different approaches will be presented, focusing on rigorous mathematical models to estimate access, including optimization and simulation under uncertainty of the model inputs. Important aspects will be covered including spatial dependence in the decision parameters of optimization models used to estimate healthcare access and Bayesian hierarchical models used to specify the sampling distributions of model inputs. The models will be illustrated for modeling access to mental healthcare in Georgia, United States.

Joint seminar CEMAT and CEAUL

Europe/Lisbon
SASlab (6.4.29) Faculty of Sciences of the Universidade de Lisboa — Online

Cláudia Neves, King’s College London and CEAUL

One way to estimate an out-of-sample quantile of an unknown distribution through extreme value theory

Within the general aim of extreme value statistics lies the estimation of an event that is so rare that might have never been witnessed in the past. Whilst the parametric estimation of an extreme quantile has found its way to the lore of many applied sciences, in terms of evaluating return levels, analogous non-parametric methodology is far less explored. This is an interesting topic because there are different albeit equivalent ways to define an (extreme) out-of-sample quantile as underpinned by different constructs arising from the same foundational extreme value theorem.

In this talk, I will address two of these definitions through the domains of attraction framework and will explain how we succeeded in generalising one of them to allow for either cases of finite or infinite upper bound to the distribution underlying the sampled data.

Joint seminar CEMAT and CEAUL

Europe/Lisbon
Amphitheatre Fa2, IST — Online

Renata M. C. R. Souza, Universidade Federal de Pernambuco

Avanços em Ciência de Dados no Paradigma de Análise de Dados Simbólicos (Symbolic Data Analysis - SDA)

Os avanços das tecnologias da informação e dos computadores têm permitido a possibilidade de armazenar grandes e múltiplas bases de dados e frequentemente estes dados podem ser não estruturados com variáveis definidas por múltiplos valores ou múltiplas unidades. Por exemplo, temperaturas diárias registadas por valores mínimos e máximos e preferência de usuários para analisar fenômenos por regiões ao invés de habitantes. A fim de reduzir o tamanho e melhorar a eficiência de modelos associados a esses dados, uma solução é obter novas unidades estatísticas para descrever os fenômenos via dados multivalorados. Em Análise de Dados Simbólicos (ADS) as entradas das bases de dados são novas unidades descritas por variáveis que não se limitam a serem valores reais uma vez que podem ser selecionados de uma lista mais ampla: conjuntos, intervalos, histogramas, árvores, gráficos, funções, fuzzy, etc. O objetivo de ADS é estender as técnicas estatísticas e aprendizagem de máquina (árvores de decisão, regras de classificação, redes neurais, análise fatorial) para dados mais complexos, chamados de dados simbólicos. Nesta última década, diferentes métodos de regressão e agrupamento para dados multivalorados têm sido propostos na literatura de ADS. Diferentes aplicações ilustram o uso desses métodos.

Joint seminar CEMAT and CEAUL

Europe/Lisbon
SASlab (6.4.29) Faculty of Sciences of the Universidade de Lisboa — Online

Heliton Tavares, Universidade Federal do Pará, Brasil

Modelos Estatísticos para Deteção de Fraudes e Aplicações

O desenvolvimento de Modelos Estatísticos para Detecção de Fraudes em Testes tem ganhado relevância nos últimos, particularmente aqueles baseados na Teoria da Resposta ao Item (TRI). Exames e avaliações podem ter suspeitas de fraude associadas se os resultados estiverem vinculados a vantagens financeiras ou vagas em instituições de ensino. Serão apresentados os principais modelos, comportamentos estatísticos associados, desempenho computacional para execução dos mesmos e uma aplicação a dados reais. Foi construído um pacote computacional no R que será apresentado e disponibilizado ao público.

Joint seminar CEMAT and CEAUL

Europe/Lisbon
SASlab (6.4.29) Faculty of Sciences of the Universidade de Lisboa — Online

Fernando Moura, Universidade Federal do Rio de Janeiro, Brasil

Modelo Beta-Beta Prime para Índices e suas Precisões com Aplicação à Estimação em Pequenas Áreas

Agências nacionais de estatística do mundo inteiro têm experimentado uma necessidade crescente de fornecer estimativas confiáveis de índices económicos e sociais, como proporções ou taxas, a nível de pequenas áreas ou pequenos domínios a partir de dados de pesquisas amostrais. No entanto, devido ao pequeno tamanho da amostra nessas áreas, não é viável obter estimativas com um nível de precisão aceitável sem usar abordagens baseadas em modelos. Este trabalho propõe modelar conjuntamente o estimador direto de índices no intervalo (0,1) e suas respectivas precisões utilizando-se as distribuições Beta e Beta prime. A novidade é modelar também o estimador de precisão amostral como uma distribuição Beta prime. Um estudo de avaliação com dados reais mostra que há ganho extra na modelagem conjunta do estimador direto e seu estimador de precisão com relação ao modelo Beta que não utiliza informação amostral sobre a precisão das estimativas. Uma aplicação para estimar o índice de insegurança alimentar em pequenas áreas do Estado de Minas Gerais, usando dados da Pesquisa Nacional de Orçamentos Familiares (POF) para o ano de 2018 é também apresentada.

Trabalho conjunto com Soraia Pereira (CEAUL/FCUL) e Giovani Silva (CEAUL/IST).

Joint seminar CEMAT and CEAUL