Inteligência artificial probabilística
-
Inteligência artificial refere-se à ciência e engenharia de sistemas artificiais capazes de realizar tarefas que exigem inteligência humana. Nos últimos anos, houve avanços interessantes em abordagens de aprendizado baseadas em dados, e machine learning e deep learning possibilitaram novas formas de sistemas computacionais perceberem o mundo. O aprendizado por reforço trouxe avanços decisivos em jogos complexos como Go e em tarefas de robótica.
-
Um aspecto central da inteligência é não apenas fazer previsões, mas também compreender a incerteza dessas previsões e considerar essa incerteza ao tomar decisões. Este artigo trata de "inteligência artificial probabilística".
Abordagem probabilística
- A primeira parte trata da abordagem probabilística para machine learning. Discute a diferença entre a incerteza "epistêmica", causada pela escassez de dados, e a incerteza "aleatória", decorrente, por exemplo, de observações e resultados com ruído. Também discute abordagens concretas para inferência probabilística e abordagens modernas para inferência aproximada eficiente.
Consideração da incerteza em tarefas de decisão sequencial
- A segunda parte aborda a consideração da incerteza em tarefas de decisão sequencial. Considera aprendizado ativo e otimização bayesiana, que são abordagens de coleta de dados por meio da proposição de experimentos informativos para reduzir a incerteza epistêmica. Também considera o aprendizado por reforço e abordagens modernas de deep RL que utilizam aproximação de função com redes neurais. Discute abordagens modernas de RL baseado em modelo, que usam incertezas epistêmica e aleatória para orientar a exploração e levar a segurança em conta.
1 comentários
Comentários do Hacker News
O texto tem diagramas explicativos excelentes e parece oferecer uma visão geral de alta qualidade sobre aprendizado de máquina sob a perspectiva da probabilidade
Encontrei este material há alguns dias e estava procurando uma desculpa para analisá-lo com seriedade, já que Andreas Krause fez pesquisas profundas e interessantes sobre Gaussian Processes e Bandits
A realidade existencial é uma distribuição de potenciais, não um arranjo de estados
Uma pergunta sobre se um LLM (ou seja, uma rede neural) pode informar a probabilidade da resposta que acabou de dar
Acho que precisamos de uma GUI para democratizar a interpretabilidade dos modelos e permitir que até gamers possam explorá-la
Acho que Gaussian Processes com o kernel adequado podem ser muito poderosos mesmo com apenas alguns pontos de dados e um pequeno conjunto de parâmetros
Parece ser uma das melhores referências sobre o tema, com alguma sobreposição parcial. É mencionado "An Introduction to Statistical Learning", de Gareth James e outros
Kevin Murphy está renomeando sua série Probabilistic Machine Learning
O Gemini 2.0 Experimental 02-05 viu isso com "apenas" 107K tokens
Laplace Approximation é uma maneira "rápida e simples" de transformar distribuições de probabilidade complexas em uma Gaussian simples (curva em sino)
Assisti a esse curso na ETH Zurich e é um dos meus favoritos