- Durante o processo de resolução do problema de Erdős #367, ferramentas de IA desempenharam um papel central, com um caso relatado de colaboração entre matemáticos humanos
- Wouter van Doorn apresentou um contraexemplo gerado por humano para a segunda parte do problema, e depois o Gemini Deepthink gerou uma prova completa da congruência relacionada
- Terence Tao publicou uma versão simplificada da prova baseada em teoria algébrica dos números p-ádicos do Gemini e depois mencionou a possibilidade de formalização em Lean
- Boris Alexeev concluiu a formalização em Lean usando a ferramenta Aristotle, da Harmonic, e verificou manualmente a proposição final para evitar abuso de IA
- Essa sequência de eventos mostra que a assistência de IA na pesquisa matemática está gradualmente se tornando um procedimento padrão
Caso de colaboração com IA no problema de Erdős #367
- Em 20 de novembro, Wouter van Doorn apresentou um contraexemplo para a segunda parte do problema, que dependia da suposição de que uma certa congruência fosse verdadeira
- Ele pediu que outros participantes verificassem a validade dessa congruência
- Algumas horas depois, Terence Tao apresentou a questão ao Gemini Deepthink e, em cerca de 10 minutos, obteve uma prova completa da congruência e a confirmação de todo o argumento
- A prova do Gemini usou teoria algébrica dos números p-ádicos, e Tao a converteu em uma prova elementar mais simples antes de publicá-la no site
- Tao comentou que essa prova poderia permitir uma “vibe formalizing” em Lean
Formalização e verificação em Lean
- Dois dias depois, Boris Alexeev concluiu a formalização em Lean usando a ferramenta Aristotle, da Harmonic
- Para evitar uso indevido de IA, a proposição final foi formalizada manualmente de forma direta
- Todo o processo levou cerca de 2 a 3 horas, e o resultado foi publicado online
- Depois disso, Tao realizou uma busca bibliográfica com ajuda de IA, mas embora houvesse alguns estudos relacionados, não encontrou nada diretamente ligado ao problema #367
Reação da comunidade e debate
- Alguns usuários acompanham com interesse, por meio das atualizações de Tao, o estado atual do uso de IA na matemática acadêmica
- Outros adotaram uma visão crítica da abordagem formalista do Lean, observando que a compreensão matemática é compressão, enquanto o Lean a decompõe em detalhes de baixo nível
- O documento relacionado “Against Lean: Why Proof Assistants Formalize the Wrong Thing” argumenta que assistentes de prova como o Lean capturam mal a essência da matemática
- Outro usuário mencionou problemas de precisão nas conversas com IA e avaliou que, embora exija ajuste fino, o uso é agradável
1 comentários
Comentários do Hacker News
É uma experiência incrível poder jogar artigos de ML com foco em matemática para um assistente de IA e receber de volta explicações simples ou pseudocódigo
Para alguém como eu, que não usava o que aprendeu na universidade há mais de 25 anos, isso ajuda demais
Dá para colocar o artigo no Claude, receber uma visão geral e continuar fazendo perguntas
Mesmo em áreas como biologia, que eu não estudei na graduação ou no mestrado, consegui me aprofundar como se estivesse conversando com um tutor experiente
Espero que pesquisadores e empresas consigam obter mais ganhos de produtividade na pesquisa científica
Mesmo um assistente imperfeito já aumenta bastante a alavancagem
Dizem que é uma startup fundada pelo CEO da Robin Hood
‘Vibe formalizing’ parece uma extensão lógica de ‘vibe engineering’ e ‘vibe coding’
Quando as peças de um problema não se encaixam bem, é interessante uma abordagem tipo ‘Move 37 as a Service’, que combina métodos informais com rigor matemático
Claro, havia partes erradas, mas pude aprofundar meu entendimento conversando e refletindo a minha própria confusão
A IA é especialmente boa em identificar os pontos em que o usuário está confuso
Ouvi uma discussão sobre a pronúncia do nome do matemático húngaro Erdős
No húngaro, a grafia e a pronúncia quase sempre coincidem, mas há exceções nos nomes
Em inglês, dizem que soa mais ou menos como “airdish”
Ex.: Görgey, Széchényi, Lánczos etc.
A ordem dos nomes húngaros, como no japonês, é sobrenome-nome (big endian). Ex.: “Erdős Pál”, “Neumann János”
É interessante notar que há reações com tendência anti-Lean nos comentários
Quero saber se é apenas divulgação de uma abordagem diferente ou se existe uma oposição filosófica ao Lean
Os resultados de usar IA em pesquisa matemática foram mistos
Às vezes ela completa automaticamente argumentos não triviais, mas em certos domínios ela se perde completamente
Ainda acho que, por enquanto, a IA só é útil como ferramenta de apoio, e não para substituir matemáticos
Na programação também houve casos em que ela não conseguiu pegar bugs triviais, embora tenha ajudado muito em tarefas complexas
No fim, essas ferramentas ainda estão longe de substituir especialistas, e o exagero no marketing pode acabar prejudicando a confiança
Como diz o ditado, ‘se prometeram a lua, precisam entregar a lua’; expectativas realistas são importantes
Não consigo acreditar que, ainda em vida, cheguei à era de dizer algo como em Star Trek: “Computador, desenhe a prova deste problema de matemática”
Seria ótimo se “Beam me up, Scotty” também fosse possível
Hoje à noite, enquanto dirigia, conversei com o ChatGPT sobre a estrutura detalhada dos escalonadores de pipeline do LLVM e do GCC
Isso aumentou muito minha produtividade, e ele organizou automaticamente minhas notas experimentais sobre compiladores
Era algo inimaginável antigamente
Claro, os resultados podem variar de pessoa para pessoa
Se derem à IA o nome de Erdos, acho que o número de Erdos de todos nós passaria a ser 1
Impressiona como ele usou bem as ferramentas de fronteira existentes para criar um ambiente colaborativo de pesquisa matemática
Por isso, ainda considero a matemática uma das raras disciplinas livres de influência pseudocientífica