Dezoito grupos de especialistas discutiram o artigo “Sparse bayesian factor analysis when the number of factors is unknown”, do estatístico Hedibert Freitas Lopes, coordenador do Núcleo de Ciências de Dados e Decisão do Insper, em coautoria com Sylvia Frühwirth-Schnatter e Darjus Hosszejni. O resultado completo (uma compilação de 112 páginas com as contribuições de cinco grupos convidados e 13 espontâneos) está na primeira edição deste ano do periódico “Bayesian Analysis”, da International Society for Bayesian Analysis (ISBA), e pode ser encontrado neste link.
A repercussão do artigo publicado em janeiro de 2024 rendeu um webinário, realizado em fevereiro de 2025, no qual o texto foi apresentado por Sylvia e comentado pelos cinco grupos de convidados. Na sequência das argumentações, Lopes e Hosszejni fizeram uma réplica às contribuições dos grupos de discussão, que haviam sido submetidas previamente aos autores. “As revistas científicas mais modernas, em geral, escolhem ou sugerem um artigo a ser aberto para discussão livre”, diz Lopes, professor titular do Insper. “Essa é uma forma de estimular a curiosidade pelo artigo entre os pares do campo de pesquisa e abrir margem para que mais gente pense no que produzimos.”
A “Bayesian Analysis” é publicada desde 2006 e tornou-se referência entre os estatísticos da escola bayesiana — uma vertente da estatística mundial que ganhou preeminência nos últimos 40 anos, representada pela ISBA. Naquela época, entre os periódicos mais tradicionais estavam os norte-americanos “Journal of the American Statistical Association” e “Annals of Statistics” e os britânicos “Biometrika” e “Journal of the Royal Statistical Society, Series B (Statistical Methodology)”. A “Bayesian Analysis” entrou, então, no top five das revistas científicas para os bayesianos.
Este é o terceiro artigo que Lopes publica no periódico, e a segunda vez em que trata do tema dos modelos fatoriais. A análise fatorial é uma técnica de estatística multivariada bastante prestigiada em economia e finanças, mas também importante em outras áreas de pesquisa em exatas, humanas e ciências médicas. A técnica foi apresentada em 1904, pelo psicólogo inglês Charles Spearman (1863-1945), que pretendia medir um fator de inteligência a partir das habilidades pessoais.
Nos 120 anos seguintes, a análise fatorial foi favorecida pelo potencial de processamento de dados da computação. “Alguns trabalhos aconteceram simultaneamente no começo dos anos 2000, um deles o artigo que escrevi a partir da minha tese de doutorado, sobre análise fatorial bayesiana”, recorda Lopes. “Esse novo artigo publicado, portanto, complementa e atualiza tudo o que aconteceu nesses 20 anos. É um artigo que solidifica três décadas da minha pesquisa em várias versões de modelos fatoriais, particularmente do ponto de vista bayesiano, e mais de uma dúzia de publicações em revistas de alto impacto dentro da estatística.”
Grosso modo, a análise fatorial ajuda a modelar grandes quantidades de dados e a encontrar correlações e interdependências em vetores. Pode servir, por exemplo, para definir a tendência profissional de um aluno do ensino médio, os preços do mercado imobiliário ou o vaivém do mercado financeiro. “É difícil encontrar um único índice sumarizando complexidades em dimensões de 10, 15 ou 20 variáveis”, diz Lopes. “Às vezes, um único índice não é capaz de explicar o que está acontecendo, como no caso da inflação, que é uma combinação de características. Mas a análise fatorial ajuda, no mínimo, a explicar que as variáveis se comportam de forma diferente e que são necessários dois ou três índices para inflação.”
Um dos projetos futuros de Lopes relacionados à análise fatorial é a modelagem não-linear dos fatores comuns (latentes) através de árvores bayesianas em aprendizagem de máquina (“machine learning”), por meio da classe de modelos “Bayesian additive regression trees” (BARTs). Ele também está interessado em continuar explorando a análise fatorial em ambientes de séries temporais, com os dados variando ao longo do tempo. “Ainda tem bastante coisa para se fazer”, afirma o professor, que foi o primeiro brasileiro eleito fellow da ISBA, em 2022.
O tempo, a propósito, é uma variável interessante da pesquisa científica. Hedibert Lopes e Sylvia Frühwirth-Schnatter deram os primeiros passos nesse trabalho em 2007, quando trabalharam durante uma visita de Sylvia à Universidade de Chicago, nos Estados Unidos, onde Lopes foi professor da Escola de Negócios (Chicago Booth) por 10 anos. Decisões pessoais acabaram levando Lopes para o Brasil em 2013 e congelaram o estudo.
Em meados de 2019, porém, o então doutorando Darjus Hosszejni, aluno de Sylvia na Universidade de Economia e Negócios de Viena, devotou-se à antiga ideia. “A empreitada do artigo tem o mérito igual de três autores, mas se não fosse um jovem como o Darjus, que dedicou todo o tempo do doutorado dele, não teríamos este artigo formalizado como está”, diz Lopes. “O processo de um artigo científico pode demorar várias décadas, mas felizmente, no nosso caso, gerou um produto que será muito utilizado na estatística.”