IA da DeepMind resolve problemas da Olimpíada Internacional de Matemática em nível de medalha de prata
(deepmind.google)- AlphaProof e AlphaGeometry 2, do Google DeepMind, conseguiram resolver problemas da Olimpíada Internacional de Matemática
- AlphaProof: sistema de raciocínio matemático baseado em aprendizado por reforço
- AlphaGeometry 2: sistema aprimorado de resolução de problemas de geometria
- Os dois sistemas resolveram 4 das 6 questões da Olimpíada Internacional de Matemática (IMO) deste ano, alcançando um desempenho de nível medalha de prata
Conquistas da IA na resolução de problemas matemáticos complexos
-
Introdução à IMO
- A mais antiga e prestigiada competição de matemática para jovens, realizada anualmente desde 1959
- Os problemas da competição abrangem álgebra, combinatória, geometria e teoria dos números
- Muitos vencedores da Medalha Fields passaram pela IMO
-
O desafio da IMO para os sistemas de IA
- AlphaProof e AlphaGeometry 2 resolveram os problemas da IMO deste ano
- As questões foram avaliadas de acordo com as regras oficiais da competição
- O AlphaProof resolveu 2 problemas de álgebra e 1 de teoria dos números
- O AlphaGeometry 2 resolveu 1 problema de geometria
- Os 2 problemas de combinatória não foram resolvidos
- No total, obtiveram 28 de 42 pontos, alcançando um desempenho de nível medalha de prata
AlphaProof: abordagem de raciocínio formal
-
Como o AlphaProof funciona
- Prova proposições matemáticas na linguagem formal Lean
- Combina um modelo de linguagem pré-treinado com o algoritmo de aprendizado por reforço AlphaZero
- Traduz problemas em linguagem natural para proposições formais, resolvendo questões de diferentes níveis de dificuldade
- Ao receber um problema, o AlphaProof gera candidatos de solução e os prova ou refuta
- Os resultados comprovados reforçam o modelo de linguagem do AlphaProof, melhorando sua capacidade de resolver problemas mais difíceis
-
Processo de treinamento
- Foi treinado provando ou refutando milhões de problemas
- Mesmo durante o período da competição, aplicou o loop de treinamento para provar variações dos problemas
AlphaGeometry 2 ainda mais competitivo
-
Melhorias do AlphaGeometry 2
- Modelo de linguagem baseado em Gemini e sistema híbrido neuro-simbólico
- Treinado com 10 vezes mais dados sintéticos do que a versão anterior
- Melhoria na velocidade e na precisão para resolver problemas de geometria
- Usa um mecanismo de compartilhamento de conhecimento ao resolver novos problemas
-
Resultados na IMO 2024
- Resolveu 83% dos problemas de geometria da IMO dos últimos 25 anos
- Na competição deste ano, resolveu a questão 4 em 19 segundos
Uma nova fronteira para o raciocínio matemático
-
Experimentos com sistemas de raciocínio em linguagem natural
- Experimentos com um sistema de raciocínio em linguagem natural baseado em Gemini
- Pode resolver problemas sem traduzi-los para uma linguagem formal
- Explora a possibilidade de combinação com outros sistemas de IA
-
Perspectivas futuras
- Matemáticos poderão colaborar com ferramentas de IA para explorar novas hipóteses, testar abordagens de resolução de problemas e encurtar processos de prova
- Sistemas de IA como o Gemini podem ampliar capacidades em matemática e raciocínio geral
Resumo do GN⁺
- AlphaProof e AlphaGeometry 2 mostram o potencial da IA no raciocínio matemático
- Ao alcançar desempenho de nível medalha de prata na Olimpíada Internacional de Matemática, comprovam a capacidade da IA de resolver problemas matemáticos
- Abrem caminho para que matemáticos explorem novas abordagens de resolução de problemas em colaboração com a IA
- Um projeto com funcionalidade semelhante é o uso de modelos de processamento de linguagem natural como o GPT-3, da OpenAI
3 comentários
Quanto mais matemáticos contribuírem para o desenvolvimento de bibliotecas de matemática formal, mais fácil será criar IAs matemáticas com bom desempenho. Até onde eu sei, atualmente há 3 coreanos transferindo para a Mathlib, a biblioteca matemática do Lean, teorias matemáticas que eles próprios formalizaram na linguagem do assistente de provas Lean.
No ano passado, participei um pouco do trabalho de migração da Mathlib do Lean 3 para o Lean 4 e, neste ano, provei um teorema em aberto na biblioteca Batteries do Lean 4.
Comentários do Hacker News
Primeiro comentário
Segundo comentário
Terceiro comentário
Quarto comentário
Quinto comentário
Sexto comentário
Sétimo comentário
Oitavo comentário
Nono comentário
Décimo comentário
Essas melhores discussões podem ser vistas aqui. https://leanprover.zulipchat.com/#narrow/stream/219941-Machine-Learnin…