Análise de Dados Bayesiana, 3ª edição (2013) [pdf]

(sites.stat.columbia.edu)

2 pontos por GN⁺ 2025-09-29 | 1 comentários | Compartilhar no WhatsApp

Análise de Dados Bayesiana é um livro amplamente utilizado nas áreas de estatística e ciência de dados
Este livro se concentra em modelagem probabilística e inferência bayesiana, abordando diversos métodos de análise aplicáveis à prática
Também cobre de forma abrangente técnicas computacionais e métodos de implementação baseados em casos reais, como MCMC
Oferece um equilíbrio entre teoria e exemplos práticos, de modo que possa ser compreendido desde iniciantes até especialistas
Tem grande utilidade também nas áreas de aprendizado de máquina, medicina e ciências sociais

Introdução

Análise de Dados Bayesiana, 3ª edição é um livro fundamental que apresenta de forma sistemática a inferência bayesiana nas áreas de estatística, ciência da computação e engenharia
Enfatiza o pensamento probabilístico e a análise de dados sob incerteza

Conceitos de modelagem bayesiana

O livro parte dos conceitos de probabilidade a priori (prior) e probabilidade a posteriori (posterior), explicando em detalhe métodos de inferência baseados em dados reais
Apresenta a teoria fundamental para lidar com várias distribuições de probabilidade, estimação de parâmetros e problemas de previsão

Aplicações em análise de dados reais

Inclui diversos estudos de caso e exemplos de aplicação com uso de conjuntos de dados reais
Também aborda em profundidade técnicas práticas como projeto de modelos, pré-processamento de dados e MCMC (Markov Chain Monte Carlo) para computação
Fornece trechos de código aplicáveis em ambientes práticos como R e Python

Tópicos avançados

Também cobre amplamente modelos estatísticos avançados, como modelos hierárquicos, análise multivariada e métodos bayesianos não paramétricos
Descreve junto métodos práticos de diagnóstico de modelos e otimização

Uso e impacto

Este livro continua sendo usado como referência em uma ampla variedade de áreas, como aprendizado de máquina, bioinformática, estatística médica, administração e ciências sociais
Permite aprender de forma sistemática ferramentas e processos de análise bayesiana que podem ser aplicados no trabalho real

1 comentários

GN⁺ 2025-09-29

Comentários no Hacker News

É meu livro de estatística favorito. O autor, Andrew Gelman, criou uma nova vertente da estatística bayesiana por meio de pesquisa teórica em modelos bayesianos hierárquicos e também lançou o Stan para aplicação prática. Estudei este livro aos poucos por cerca de um ano, incluindo os apêndices. Depois disso, ele serviu de base para meu estudo de modelos bayesianos hierárquicos e foi extremamente útil. Mais do que um livro introdutório, recomendo fortemente para quem quer elevar seu nível em estatística. Sugiro ler primeiro os capítulos 1 a 5 para entender bem a filosofia de modelagem de Gelman e, para os temas mais interessantes, selecionar a leitura olhando o sumário
- Gosto muito do Gelman, mas dizer que ele “criou uma nova vertente da estatística bayesiana” é um pouco exagerado
- Pergunta pedindo recomendação de livros ou cursos de estatística para ler antes de conseguir entender este livro
- Fica a dúvida se há algum bom livro focado em estatística aplicada a testes reais, como pesquisa médica, otimização e manufatura
Conheci Gelman pela primeira vez graças a uma excelente explicação visual sobre regressão linear. Lá também citavam Regression and Other Stories, mas como não cobria os capítulos sobre Bayes, fiquei com vontade de ler mais sobre o tema
Já vivi na prática o quanto a análise bayesiana pode ser útil. Nossa equipe certa vez precisou decidir quantos itens, entre vários milhões, deveriam ser amostrados para permitir verificação de qualidade, e encontramos uma solução muito elegante com análise bayesiana. A matemática em si não era difícil, e mesmo assim me surpreendeu ver engenheiros tão conservadores para aprender esse tipo de técnica básica. Ainda mais porque todos tinham aprendido bem a matemática do primeiro ano da faculdade
- Fico curioso sobre o que exatamente os engenheiros rejeitaram e por que isso deveria ser aprendido. Muitos engenheiros até fazem uma disciplina introdutória de estatística, mas não está claro por que precisariam aprender estatística bayesiana. Aliás, até interpretar corretamente p-value, coeficientes de regressão e efeitos de interação já é difícil, e talvez tenha pouca utilidade prática. Por outro lado, também não faz sentido exigir que cientistas de dados cuidem de toda a engenharia, como pipelines de automação de deploy, pods do Kubernetes ou treino distribuído de modelos em pytorch; existe o princípio da divisão de trabalho
BDA é o melhor livro para aprender modelagem bayesiana com rigor e profundidade. Além dele, há várias abordagens, como Statistical Rethinking, de Richard McElreath, e Regression and other stories, de Gelman e Aki. Eu mesmo escrevi um livro com foco em código e exemplos, disponível gratuitamente em acesso aberto
O link para os materiais de aula relacionados pode ser visto aqui
Gosto do blog de estatística tocado pelo Gelman em Columbia. Em statmodeling.stat.columbia.edu há várias discussões sobre estatística
- Obrigado por compartilhar; se houver algum texto que tenha te marcado especialmente, gostaria de recomendações
Para iniciantes, achei Doing Bayesian Data Analysis, de John Kruschke, muito melhor por ser fácil de entender e confortável de ler
- BDA é um livro para pós-graduandos e, embora a matemática não seja especialmente difícil, ele pressupõe leitores que tenham ao menos feito um primeiro curso de estatística matemática
Tenho muito interesse, mas este livro parece pesado demais. Seria ótimo ter um curso intensivo só para aprender rapidamente técnicas bayesianas voltadas a engenheiros de performance de sistemas. Se alguém conhecer bem as duas áreas, queria saber o que esse curso deveria cobrir e também recomendações de material para estudar sozinho
- Quando ensino estatística, o livro que sempre uso é Statistical Rethinking. Ele foca em como realmente pensar sobre modelagem: analisar hipóteses e entender as hipóteses implícitas no modelo. Tem suas partes difíceis, mas isso também faz parte da graça, e o livro ensina isso muito bem. O ponto fraco é não ser gratuito (mas as aulas do autor estão de graça no YouTube, então recomendo fortemente ao menos as aulas mesmo sem o livro). Além disso, Regression and Other Stories, do qual Gelman é um dos autores, é um livro que explica esse tema de forma mais acessível. Também recomendo Think Bayes e Bayesian Methods for Hackers para iniciantes com background em programação. No campo de machine learning, para um foco nas vantagens de métodos probabilísticos (bayesianos), recomendo Probabilistic Machine Learning, de Kevin Murphy. Só li a edição antiga, mas ouvi avaliações excelentes sobre a nova
- Bayesian Methods for Hackers (GitHub) e os materiais online de O'Reilly Bayesian Methods for Hackers também valem a pena
O pensamento quantitativo básico e o senso estatístico continuam importantes. Mesmo que você não aprenda isso por Bayes, precisa aprender em algum lugar. Pela “regra da raiz quadrada de n”, a razão sinal-ruído melhora proporcionalmente à raiz quadrada do número de medições. Mas, como meu pai dizia, é preciso cuidado porque “quanto mais você tira a média de dados ruins, maior a chance de chegar cada vez mais perto da resposta errada”
Modelos fundacionais podem ser vistos como uma espécie de estimador aproximado de probabilidade a posteriori (interference), mas a incerteza em geral é omitida nesse processo. Se aproveitassem melhor uma abordagem bayesiana, o desempenho poderia até melhorar
Há muitos problemas em que o conjunto de dados não é gigantesco, então modelos fundacionais não servem para tudo; dependendo da tarefa, métodos bayesianos continuam muito válidos
A regra de Bayes é fundamental para inferência probabilística, então métodos bayesianos são necessários para lidar quantitativamente com incerteza. Ainda falta eficiência para aplicá-los em modelos de deep learning, mas em princípio podem produzir resultados melhores
Também é perfeitamente possível ajustar modelos bayesianos com dados grandes e redes neurais, por exemplo com inferência variacional, então a relevância continua existindo
Estou aguardando o livro Bayesian workflow

Análise de Dados Bayesiana, 3ª edição (2013) [pdf]

Introdução

Conceitos de modelagem bayesiana

Aplicações em análise de dados reais

Tópicos avançados

Uso e impacto

Leituras relacionadas

1 comentários

Comentários no Hacker News