Graduação em Estatística

Defesas 2021/1

Análise de dados composicionais

Discente: Ana Paula de Castro Silva

Os Dados Composicionais (ou Compositional Data, CoDa, acrônimo inglês) são descrições quantitativas das partes de algum todo, que transmitem informações de forma relativa ao total. O grande diferencial nesse tipo de situação é que as componentes dos dados apresentam soma constante, 1 – para proporções e 100 – para porcentagens. Devido a esta restrição, os dados composicionais possuem uma estrutura própria, denominada Simplex (espaço natural para tais dados), no qual as operações realizadas podem não ter correspondência evidente com métodos usuais do espaço real. Tal fato culmina no uso de algumas transformações que permitem uma equivalência entre o espaço euclidiano (real) e o espaço simplex, sendo possível usufruir das facilidades usuais da estatística e depois retornar ao espaço com restrições. O trabalho abordou as transformações composicionais, exibiu os princípios da análise composicional, as operações em composições, a análise exploratória apropriada e a adequação de modelos, além de explicitar simulações e aplicação prática, que demonstrou a eficácia e confiabilidade de estudos utilizando os métodos composicionais em detrimento aos métodos usuais.

Palavras-chave: Dados composicionais, Transformações composicionais, Regressão ridge.

Orientador: Prof. Dr. Tiago Maia Magalhães

02 de setembro de 2021, às 10h

Link para ouvintes – Senha: CURSOESTATISTICA

Estudo de métodos para avaliar as variáveis representativas nas publicações de uma empresa varejista

Discente: Rebecca Cláudio Carneiro

Para que o perfil de uma empresa deixe sua marca em uma rede social e alcance um número significativo de pessoas é necessário que haja um processo de implantação conhecendo os fatores que atraem suas publicações. Esse trabalho se propôs a estudar os diferentes métodos de planejamento de experimentos (DOE), afim de identificar o método mais adequado para avaliar as variáveis que influenciam significativamente no engajamento das publicações realizadas em um perfil comercial através do Instagram®. As sete etapas de planejamento de experimentos foram estudadas para delinear uma matriz experimental recomendada para futuras aplicações.

Palavras-chave: Instagram®, Engajamento, Varejo, Planejamento de experimentos, Fatorial fracionário 2k-p, Matriz experimental.

Orientadora: Profa. Dra. Ângela Mello Coelho

03 de setembro de 2021, às 14h

Link para ouvintes – Senha: CURSOESTATISTICA

Modelagem de dados longitudinais complexos no R: Desenvolvimento de um pacote estatístico

Discente: Pedro Henrique de Mesquita Pacheco

O surgimento dos computadores digitais a partir da segunda metade do século XXI revolucionou o uso da estatística, pois, possibilitou que metodologias, antes inviáveis de serem colocadas em prática, fossem exploradas. Em particular, pesquisas longitudinais começaram a ser cada mais utilizadas em um contexto envolvendo grandes pesquisas. Surgiram então problemas sobre a incorporação do plano amostral das pesquisas às metodologias matemáticas e também a tradução de tais abstrações matemáticas para termos práticos computacionais. No que diz respeito a modelos longitudinais de efeitos fixos e aleatórios e modelos longitudinais de covariância estruturada, ambos envolvendo o plano amostral complexo, o presente trabalho visa apresentar técnicas computacionais capazes de solucionar a segunda parte do problema da modelagem estatística destacado anteriormente, por meio da discussão e criação de um pacote na linguagem de programação R, denominado ‘clm’. Ao longo deste estudo foram discutidas boas práticas da programação que visam o desenvolvimento de um código limpo e sustentável e também possíveis estratégias a serem adotadas para solucionar o problema de implementação dos modelos longitudinais complexos, como por exemplo, o uso de fluxogramas. Ao final, foram apresentados os resultados de tais práticas analisando as principais funções do pacote desenvolvido e também uma aplicação exemplificando seu uso, buscando destacar os benefícios proporcionados por este trabalho.

Palavras-chave: Modelos Longitudinais, Amostragem Complexa, Programação em R.

Orientador: Prof. Dr. Marcel de Toledo Vieira

08 de setembro de 2021, às 15h

Link para ouvintes – Senha: CURSOESTATISTICA

Aplicação de modelo de regressão logística multinomial em predição

Discente: Jose Roberto Peres Junior

A análise de regressão é uma ferramenta estatística muito utilizada em modelos preditivos, entretanto vários dos problemas apresentados possuem como resposta de interesse variáveis categóricas multinomiais. Nesses casos, a regressão logística multinomial, com função de ligação logit, é uma ferramenta que pode ser usada na construção de modelos preditivos. A seleção das variáveis explicativas do modelo de regressão logística multinomial é uma etapa importante na aplicação da técnica. Há vários procedimentos para essa tarefa ser efetuada, sendo eles automatizadas ou não. Dentre outras possibilidades, optamos por utilizar neste trabalho o método stepwise e o método não automatizado proposto por Hosmer e Lemeshow (20) aplicados no conjunto de dados penguins, disponível no pacote palmerpenguins do R.

Palavras-chave: Regressão logística multinomial, Variáveis categóricas multinominais, Logit, Conjunto de dados penguins e Seleção de variáveis.

Orientador: Prof. Lupércio França Bessegato

08 de setembro de 2021, às 17h

Link para ouvintes – Senha: CURSOESTATISTICA

Técnicas e visualização de agrupamentos em aprendizagem não supervisionada com aplicações

Discente: Calvin Silva Rodrigues

Na última década, a quantidade de informações armazenadas no formato digital tem crescido exponencialmente, levando à necessidade cada vez maior de produção de procedimentos computacionalmente intensivos que auxiliem na geração de informação a partir desses dados. Dentre outras, a área de aprendizagem estatística não supervisionada fornece técnicas que auxiliam na obtenção de informação a partir desses dados sem que estejam associados a respostas. Dessa maneira, esse trabalho propôs estudar técnicas de agrupamento e de redução de dimensionalidade, a fim de explicar a configuração dos dados a partir de medida de distância entre objetos. Em redução de dimensionalidade foram explorados métodos de escalonamento multidimensional métrico e não métrico para visualizar previamente os possíveis grupos formados em um espaço de dimensão reduzida. Por sua vez, para agrupamento, foram utilizados os procedimentos K-médias, AGNES e DIANA, no qual o primeiro, que agrupa de maneira particionada, solicita previamente o número de grupos a ser formado, enquanto os demais, que agrupam hierarquicamente, contornam esse problema em troca da definição da medida de ligação entre grupos. Por fim as metodologias estudadas foram aplicadas em conjuntos de dados reais com o software R Core Team (2020).

Palavras-chave: Aprendizagem não supervisionada, Análise de agrupamento, Redução de dimensionalidade, Escalonamento multidimensional e Visualização multivariada.

Orientador: Prof. Lupércio França Bessegato

10 de setembro de 2021, às 14h

Link para ouvintes – Senha: CURSOESTATISTICA

Modelo para dados longitudinais de contagem longitudinais: Uma aplicação para dados da covid-19

Discente: Jéssica Vianelo Sell

Desde dezembro de 2019, quando foi confirmado o primeiro caso de Covid-19 na cidade de Wuhan (China), muitos estudos estão sendo produzidos sobre o novo coronavírus. O presente trabalho tem a intenção de estudar o comportamento do número de casos e de óbitos em cidades brasileiras com população entre 200 mil e 1 milhão de habitantes de acordo com as projeções do IBGE para 2020. A partir da Análise de Dados de Longitudinais e aplicação de um Modelo de Poisson, foi analisada a relação entre o número de óbitos pelo Covid-19 na população e e um conjunto de variáveis explicativas.

Palavras-chave: Óbitos, Pandemia, Análise de Dados Longitudinais, Regressão de Poisson.

Orientador: Prof. Dr. Marcel de Toledo Vieira

10 de setembro de 2021, às 16h

Link para ouvintes – Senha: CURSOESTATISTICA

Análise de dados amostrais longitudinais da pesquisa de avaliação de impacto do bolsa família

Discente: Gabriela Theotonio dos Santos

Este trabalho tem por objetivo avaliar se os dados da pesquisa de Avaliação de Impacto do Bolsa Família podem confirmar teorias sociológicas sobre questões do aumento no poder de decisão do gênero feminino, encontrando utilidade nestes dados pois sabe-se que a maioria dos titulares do benefício do Bolsa Família são mulheres, condição pré-estabelecida na própria regulamentação deste Programa de Transferência de Renda. Estes dados da AIBF tratam-se de um estudo longitudinal, ou seja, uma mesma amostra foi observada por duas rodadas, uma feita em 2005 e a outra em 2009, onde há registra-se a situação de gastos, saúde, roupas, educação, alimentação, avaliando o titular, o seu cônjuge e seus filhos, para fins de comparação destas noções entre beneficiários ou não beneficiários do Programa Bolsa Família. Através desta pesquisa, considerando o seu plano amostral, será desenvolvido um método para mensurar o poder de decisão da mulher dentro do domicílio, para que possa verificar se há fundamentação estatística para apoiar os estudos sociológicos que dizem que o poder de decisão da mulher aumentou devido a sua titularidade no Programa, já que as mulheres parecem decifrar melhor aquilo que é necessário para o seu domicílio.

Palavras-chave: Bolsa-Família, Empoderamento Feminino, Análise Longitudinal

Orientador: Prof. Dr. Marcel de Toledo Vieira

14 de setembro de 2021, às 15h

Link para ouvintes – Senha: CURSOESTATISTICA

QR CODE:

SENHA: CURSOESTATISTICA

Graduação em Estatística

li.page_item .children .page_item a,li.page_item .children .page_item .children a{color: #252525 !important;} Defesas 2021/1

Análise de dados composicionais

Discente: Ana Paula de Castro Silva

Estudo de métodos para avaliar as variáveis representativas nas publicações de uma empresa varejista

Discente: Rebecca Cláudio Carneiro

Modelagem de dados longitudinais complexos no R: Desenvolvimento de um pacote estatístico

Discente: Pedro Henrique de Mesquita Pacheco

Aplicação de modelo de regressão logística multinomial em predição

Discente: Jose Roberto Peres Junior

Técnicas e visualização de agrupamentos em aprendizagem não supervisionada com aplicações

Discente: Calvin Silva Rodrigues

Modelo para dados longitudinais de contagem longitudinais: Uma aplicação para dados da covid-19

Discente: Jéssica Vianelo Sell

Análise de dados amostrais longitudinais da pesquisa de avaliação de impacto do bolsa família

Discente: Gabriela Theotonio dos Santos

Defesas 2021/1