1 pontos por GN⁺ 2024-01-18 | 1 comentários | Compartilhar no WhatsApp

AlphaGeometry: sistema de IA de geometria em nível de olimpíada

  • AlphaGeometry é um sistema de IA que supera as abordagens de ponta na resolução de problemas de geometria, demonstrando o avanço da IA no campo do raciocínio matemático.
  • A Olimpíada Internacional de Matemática é a arena moderna onde competem os melhores estudantes de matemática do ensino médio do mundo, e vem se consolidando como um campo de prova para as capacidades matemáticas e de raciocínio de sistemas de IA.
  • AlphaGeometry é um sistema de IA capaz de resolver problemas complexos de geometria em um nível próximo ao de medalhistas de ouro humanos em olimpíadas, resolvendo 25 de 30 problemas de geometria de olimpíada dentro do tempo padrão.
  • O sistema de ponta anterior resolveu 10 problemas, e um medalhista de ouro humano médio resolve 25,9 problemas.
  • AlphaGeometry combina o poder preditivo de um modelo de linguagem neural com um mecanismo de raciocínio baseado em regras para realizar o raciocínio necessário à resolução de problemas.
  • Foi desenvolvido um método para gerar 100 milhões de exemplos únicos, permitindo treinar o AlphaGeometry sem demonstrações humanas.

Abordagem neuro-simbólica do AlphaGeometry

  • AlphaGeometry é um sistema neuro-simbólico composto por um modelo de linguagem neural e um mecanismo de raciocínio simbólico, que colaboram para encontrar provas de teoremas geométricos complexos.
  • O modelo de linguagem prevê rapidamente padrões gerais e relações nos dados, mas carece de capacidade para raciocínio rigoroso ou para explicar decisões.
  • O mecanismo de raciocínio simbólico baseia-se em lógica formal e usa regras claras para chegar a conclusões; é racional e explicável, mas sozinho é “lento” e pouco flexível ao lidar com problemas grandes e complexos.
  • O modelo de linguagem do AlphaGeometry prevê novos elementos de construção úteis para resolver problemas de geometria, guiando o mecanismo simbólico na direção da solução.

Geração de 100 milhões de exemplos de dados sintéticos

  • A geometria se baseia na compreensão de espaço, distância, forma e posição relativa, sendo importante em diversas áreas como arte, arquitetura e engenharia.
  • AlphaGeometry usa uma abordagem de geração de dados sintéticos para poder ser treinado do zero, imitando em larga escala o processo de construção de conhecimento.
  • O sistema gera 1 bilhão de diagramas geométricos aleatórios e, a partir de cada diagrama, deriva minuciosamente todas as relações entre pontos e linhas.
  • Esse enorme conjunto de dados, após excluir exemplos semelhantes, resulta em um dataset de treinamento final composto por 100 milhões de exemplos únicos.

Liderando o raciocínio matemático com IA

  • Todas as soluções dos problemas de olimpíada fornecidas pelo AlphaGeometry foram verificadas e validadas por computador.
  • Os resultados são comparados com métodos anteriores de IA e com o desempenho humano em olimpíadas.
  • Embora o AlphaGeometry só se aplique a problemas de geometria de olimpíada, ele já é, por si só, o primeiro modelo de IA do mundo a atingir o nível de medalha de bronze da IMO.
  • O sistema se baseia no trabalho de liderança em raciocínio matemático com IA do Google DeepMind e do Google Research, com aplicações que vão da exploração da beleza da matemática pura à resolução de problemas de matemática e ciência com modelos de linguagem.

GN⁺ Opinião:

  • O resultado do AlphaGeometry é importante por abrir uma nova fronteira para a aplicação de IA na resolução de problemas de geometria.
  • O sistema demonstra a capacidade da IA de resolver problemas matemáticos complexos, uma competência essencial para o desenvolvimento de futuros sistemas de IA geral.
  • Com o AlphaGeometry sendo lançado como código aberto, espera-se uma grande expansão das possibilidades de uso de IA em pesquisa matemática e científica.

1 comentários

 
GN⁺ 2024-01-18
Comentários do Hacker News
  • Resumo dos comentários do Hacker News:
    • Esta pesquisa parece um trabalho muito mais prático do que os artigos anteriores de IA para matemática da DeepMind. A IA é usada para aprender teoremas de geometria e encontrar provas, tentando demonstrações ao adicionar estruturas geométricas de forma aleatória.
    • Este modelo pode ter dificuldade para generalizar, mas a abordagem neuro-simbólica é muito promissora. Ela conecta o sistema 1 (ferramentas de ML) ao sistema 2 (geração lógica de provas), possibilitando aprendizado auto-supervisionado.
    • Há curiosidade sobre com que frequência o modelo de linguagem gera construções úteis. No artigo, várias construções auxiliares alternativas são propostas e processadas em paralelo para acelerar o processo.
    • Agradecimento aos autores por terem liberado o código e os pesos. Isso cria uma base para que outros pesquisadores deem continuidade ao trabalho.
    • É interessante que o modelo Transformer usado seja pequeno. O artigo descreve as especificações concretas do Transformer.
    • A citação de Evan Chen confirma que as provas geradas pela IA estão em uma forma legível para humanos. Evan Chen é um membro conhecido da comunidade de matemática de olimpíadas.
    • Surpresa pelo fato de a técnica anterior de ponta conseguir resolver 10 desses problemas. Existem algoritmos práticos para resolver problemas de geometria plana.
    • O ChatGPT não conseguiu resolver problemas no estilo da IMO, mas, se esta pesquisa for real, trata-se de um grande avanço. Encontrar provas geométricas é uma expressão de inteligência, e isso parece aproximar da AGI.
    • Há perguntas sobre o sistema dedutivo usado para verificar as provas. As convenções da geometria de olimpíadas diferem de outras áreas da matemática, e não está claro como formalizar essa lógica sem contradições.

Este resumo foi baseado nos comentários do Hacker News e organiza de forma concisa os pontos principais de cada comentário. Inclui discussões sobre os avanços da pesquisa em IA e provas geométricas, as características do modelo e o quanto esse tipo de pesquisa parece aproximar a inteligência artificial da AGI.