Modelo da OpenAI refutou uma conjectura central da geometria discreta

(openai.com)

1 pontos por GN⁺ 2026-05-21 | 2 comentários | Compartilhar no WhatsApp

O problema da distância unitária é um problema de Erdős de 1946 que pergunta qual é o número máximo de pares de pontos a distância 1 entre n pontos no plano, e uma antiga conjectura central foi refutada
O modelo de raciocínio de propósito geral da OpenAI criou uma família infinita de exemplos que quebra a crença de que a família da grade quadrada era essencialmente a melhor possível, e apresentou uma melhoria em nível polinomial
A nova construção produz mais de n^{1+δ} pares de pontos a distância unitária para infinitos valores de n, e um refinamento de Will Sawin mostra que δ = 0.014 é possível
A prova aplica ferramentas de teoria algébrica dos números a um problema geométrico, indo além dos inteiros gaussianos e usando torre infinita de corpos de classes e teoria de Golod–Shafarevich
O resultado mostra que a IA pode contribuir com descobertas matemáticas originais em problemas abertos antigos, tornando a expertise humana ainda mais importante na escolha e interpretação dos problemas

Avanço no problema da distância unitária

O problema da distância unitária é um problema de geometria combinatória que pergunta quantos pares de pontos exatamente à distância 1 podem ser formados no máximo entre n pontos colocados no plano
Foi proposto por Paul Erdős em 1946, e o livro de 2005 de Brass, Moser e Pach, Research Problems in Discrete Geometry, descreve esse problema como “talvez o problema mais conhecido e mais fácil de explicar da geometria combinatória”
O combinatorista de Princeton Noga Alon o apresentou como um dos problemas de que Erdős mais gostava, e Erdős ofereceu um prêmio por sua solução
Por muito tempo, acreditou-se que a família de construções em grade quadrada produzia essencialmente o número máximo de pares de pontos a distância unitária
Um modelo interno da OpenAI criou uma família infinita de exemplos que refuta essa antiga conjectura e oferece uma melhoria em nível polinomial
A prova foi revisada por um grupo de matemáticos externos, que também escreveram um artigo complementar tratando do argumento, do contexto e do significado do resultado
O texto original da prova pode ser visto em unit-distance-proof.pdf, o artigo complementar em unit-distance-remarks.pdf, e uma versão resumida da cadeia de raciocínio do modelo em unit-distance-cot.pdf

O método encontrado pela IA

A prova veio de um sistema treinado para matemática, de um scaffolding para buscar estratégias de prova e de um modelo de raciocínio de propósito geral, e não de um sistema dedicado especificamente ao problema da distância unitária
A avaliação foi feita como parte de um esforço mais amplo para medir se modelos avançados podem contribuir com pesquisa de ponta, usando uma coletânea de problemas de Erdős, e neste caso foi gerada uma prova que resolve um problema em aberto
A matemática é um domínio claro para testar capacidade de raciocínio porque os problemas são precisos, provas candidatas podem ser verificadas e argumentos longos precisam manter consistência do início ao fim
A prova aplica ideias inesperadas e sofisticadas de teoria algébrica dos números a um problema geométrico de aparência elementar
Tim Gowers descreveu o resultado no artigo complementar como “um marco para a matemática com IA”
O teórico dos números Arul Shankar avaliou que os modelos atuais de IA já mostram ser capazes de ir além de assistentes de matemáticos humanos, produzindo ideias originais e sofisticadas e levando-as até o fim

O conteúdo matemático do problema da distância unitária

u(n) é definido como o número máximo possível de pares de pontos a distância unitária entre n pontos no plano
Uma construção simples pode colocar n pontos em uma reta e produzir n−1 pares, enquanto uma grade quadrada produz cerca de 2n pares
A melhor construção conhecida anteriormente vinha de uma grade quadrada reescalada e produzia n^{1 + C / log log(n)} pares de pontos a distância unitária, para alguma constante C
Como log log(n) cresce à medida que n aumenta, o termo adicional no expoente tende a 0, então o crescimento dessa construção fica apenas um pouco acima do linear
Durante décadas, acreditou-se amplamente que essa taxa era essencialmente a melhor possível, e Erdős conjecturou tecnicamente um limite superior de n^{1+o(1)}
O novo resultado refuta essa conjectura ao construir, para infinitos valores de n, configurações de n pontos com pelo menos n^{1+δ} pares de pontos a distância unitária, para algum expoente fixo δ > 0
A prova original da IA não fornecia um valor explícito para δ, mas um refinamento posterior do professor de matemática de Princeton Will Sawin mostrou que é possível tomar δ = 0.014

Por que o resultado é surpreendente

Desde a construção original de Erdős em 1946, o melhor limite inferior conhecido havia permanecido essencialmente inalterado
O melhor limite superior conhecido, O(n^{4/3}), veio do trabalho de Spencer, Szemerédi e Trotter em 1984, e permaneceu essencialmente intacto desde então, apesar de refinamentos e estudos de estruturas relacionadas por Székely, Katz e Silier, Pach, Raz, Solymosi e outros
Matoušek e Alon-Bucić-Sauermann estudaram esse problema para distâncias não euclidianas no plano, e apresentaram resultados mostrando que “a maioria” das distâncias não euclidianas segue, em certo sentido, a conjectura de Erdős, o que a reforçava
É especialmente surpreendente que o ingrediente central da nova construção venha da teoria algébrica dos números, que à primeira vista parece distante de geometria e distância
A teoria algébrica dos números é a área que trata de conceitos como fatoração dentro de extensões dos inteiros chamadas corpos de números algébricos

Novas técnicas vindas da teoria algébrica dos números

A nova prova parte de ideias geométricas familiares e se expande em uma direção inesperada
O limite inferior original de Erdős pode ser entendido por meio dos inteiros gaussianos da forma a + bi
Aqui, a e b são inteiros, e i é a raiz quadrada de −1
Os inteiros gaussianos estendem os inteiros usuais e possuem propriedades como fatoração única em primos, assim como os inteiros
Extensões desse tipo dos inteiros ou dos racionais são chamadas de corpos de números algébricos
O novo argumento substitui os inteiros gaussianos por generalizações mais complexas da teoria algébrica dos números, cuja simetria mais rica permite criar mais diferenças de comprimento unitário
O argumento exato usa ferramentas como torre infinita de corpos de classes e teoria de Golod–Shafarevich para mostrar que os corpos numéricos necessários realmente existem
Essas ideias já eram bem conhecidas pelos teóricos dos números, mas o fato de influenciarem um problema geométrico no plano euclidiano foi recebido como uma grande surpresa

O significado para a matemática

O fato de um sistema de IA ter resolvido de forma autônoma um antigo problema em aberto no centro de uma área ativa torna este um momento importante na interação entre IA e matemática
O trabalho complementar dos matemáticos externos oferece um quadro mais rico que não aparece apenas na solução original
Thomas Bloom escreveu no artigo complementar que, ao avaliar a importância de uma prova gerada por IA, a pergunta é se essa prova ensinou algo novo sobre o problema e se ajudou a entender melhor a geometria discreta
Bloom avaliou que o resultado mostra que construções de natureza teórica dos números podem dizer muito mais sobre essas questões do que se esperava, e que a teoria dos números necessária pode ser muito profunda
Bloom acredita que, nos próximos meses, muitos teóricos algébricos dos números vão examinar de perto outros problemas em aberto da geometria discreta
A conexão inesperada entre teoria algébrica dos números e geometria discreta não serve apenas para resolver uma conjectura específica, mas se torna uma ponte para explorar mais problemas relacionados
O resultado mostra que a IA pode contribuir não só com respostas, mas também com descobertas matemáticas cujo significado se torna mais claro e mais rico por meio da compreensão humana posterior

Por que isso importa

Um raciocínio matemático melhor pode tornar a IA uma parceira de pesquisa mais poderosa
Ela pode manter de forma consistente longas cadeias de pensamento, conectar ideias entre áreas de conhecimento distantes e revelar caminhos promissores que especialistas talvez não priorizassem
Isso pode ajudar pesquisadores a avançar em problemas complexos demais ou demorados demais para serem tratados com facilidade
Essa capacidade é útil não só na matemática, mas também em biologia, física, ciência dos materiais, engenharia e medicina
Se conseguir manter argumentos complexos de forma consistente, conectar áreas distantes do conhecimento e produzir resultados que passem por revisão especializada, isso passa a fazer parte do caminho de longo prazo rumo a sistemas de pesquisa mais automatizados
Sugere-se que a IA começará a assumir um papel muito sério na parte criativa da pesquisa, especialmente na própria pesquisa em IA
Esse avanço reforça a urgência de entender o problema do alinhamento de sistemas muito inteligentes, a próxima etapa do desenvolvimento de IA e o futuro da colaboração entre humanos e IA
Esse futuro ainda depende do julgamento humano
A expertise não se torna menos importante; ela se torna mais valiosa
A IA pode ajudar a explorar, propor e verificar, mas cabe às pessoas escolher os problemas importantes, interpretar os resultados e decidir quais questões perseguir em seguida

2 comentários

GN⁺ 29 일 전

Comentários no Lobste.rs

Olhando para este resultado e para a tendência recente, não há mais dúvidas de que a IA mais moderna consegue fazer trabalho muito inovador e original
Há um ano eu teria discordado, mas, se você ainda está cético, recomendo ler os comentários deixados por matemáticos de ponta na área a que essa prova chega
Mesmo havendo muitas preocupações válidas em torno da IA, acho que agora precisamos reconhecer que entramos em um novo mundo estranho
- Minha oposição à IA não é que “ela não funciona bem”. Pelo contrário, quanto melhor funciona, pior me parece o mundo que estamos construindo
  Acho que o futuro que estamos montando não é bom para as pessoas
- Ainda não tenho certeza de que este resultado atenda ao padrão de evidência necessário para sustentar a afirmação de que LLMs conseguem fazer trabalho original
  Se os matemáticos dizem que este trabalho está correto, confio nisso, mas eles podem não ser especialistas em avaliar se LLMs conseguem gerar ideias originais, então filtraria esse tipo de avaliação
  Já houve muitos casos de especialistas famosos em X falando com muita convicção sobre Y, especialmente sobre LLMs, e errando de forma constrangedora. Não estou dizendo que este seja um desses casos, apenas que essa possibilidade existe
- Não dá para copiar e colar no site da OpenAI, então, para quem tiver interesse, anotei os matemáticos citados no texto
  https://en.wikipedia.org/wiki/Noga_Alon
  https://en.wikipedia.org/wiki/Arul_Shankar
  https://en.wikipedia.org/wiki/Timothy_Gowers
  https://en.wikipedia.org/wiki/Jacob_Tsimerman
  Não conheço bem a área, mas, à primeira vista, parecem confiáveis. Talvez os LLMs acabem contribuindo muito mais para demonstrações matemáticas do que para programação, mas, honestamente, não sei
  De todo modo, o texto foi publicado pela OpenAI, e ela pode afirmar qualquer coisa. Quando você reúne pesquisadores de ponta em matemática e aprendizado de máquina, fico curioso sobre quanto do trabalho foi deles, quanto o “modelo” realmente encontrou do resultado, quantas tentativas fracassadas houve etc.
  Também me pergunto se isso vai resistir ao tempo. Quase nunca, ou talvez nunca, aparecem manchetes do tipo “olhando em retrospecto, o anúncio espetacular de X meses atrás na verdade não era tudo isso”
- Se os modelos ficarem melhores em matemática, eles podem engolir todas as provas simples com as quais futuros matemáticos aprendiam, publicavam seu primeiro artigo e treinavam o raciocínio
  Isso é parecido com a situação em que futuros programadores já não digitam código manualmente
  Para aprender matemática, é preciso muita prática, e, para provar uma proposição geral, você precisa forçar a cabeça a pensar de um jeito novo; além disso, provar algo sem saber se a resposta é P ou not-P exige aceitar bastante incerteza
  Por isso fico um pouco preocupado com o futuro da matemática. Se o critério para uma primeira prova passar a ser “algo que um milhão de modelos de IA de fronteira não conseguiram provar”, será que o número de matemáticos realmente competentes não vai diminuir?
- Eu li aqueles comentários de outra forma. Falaram em “trabalho muito inovador e original”, mas a longa citação de Thomas Bloom diz o seguinte
  “A fronteira do conhecimento é muito pontiaguda e irregular. Nos próximos meses e anos, veremos sucessos semelhantes em várias outras áreas da matemática. Problemas antigos em aberto serão resolvidos quando a IA revelar conexões inesperadas e levar os mecanismos técnicos existentes ao limite. A IA está nos ajudando a explorar de forma mais completa a catedral da matemática que construímos ao longo de séculos. Que outras maravilhas invisíveis ainda estarão esperando nos bastidores?”
  O que mais chama atenção aqui é “revelar conexões inesperadas”, “levar os mecanismos técnicos existentes ao limite” e “ajudar a explorar de forma mais completa”
  Dá para discutir o que é pensamento, o que é inovação, o que é descoberta, mas essa citação, escolhida pela própria OpenAI, claramente não vai nessa direção
  Na pesquisa científica, a amplitude do conhecimento e dos campos já é uma limitação — e às vezes uma preocupação — há muito tempo. Conectar áreas sempre teve valor, inclusive fora da pesquisa, e, se os LLMs puderem ajudar nisso, ótimo, mas eu ainda não chamaria isso de inovação
Tenho algumas dúvidas. Seria ótimo se alguém pudesse ajudar a encontrar respostas
1. Queria saber se existe em algum lugar uma explicação fácil desta prova para quem não conhece bem geometria discreta
2. Que modelo era esse? Só dizem que era algum modelo “otimizado para raciocínio geral”
3. Quem reescreveu o processo de pensamento e que tipo de edição foi feita?
4. Os comentaristas puderam ver a cadeia de raciocínio original (CoT)?
- Hoje em dia, os modelos de fronteira com recursos de raciocínio provavelmente não divulgam os rastros de pensamento para impedir que concorrentes como a DeepSeek roubem tokens
  Imagino que modelos acadêmicos e de pesquisa mais especializados também serão distribuídos da mesma forma
O resumo diz o seguinte
“Apresentamos uma versão curta, organizada e verificada por humanos da recente refutação gerada pela OpenAI da conjectura da distância unitária de Erdős, junto com uma série de reflexões sobre ela. O argumento depende de forma essencial, ao menos em retrospecto, de ideias que podem ser atribuídas a Ellenberg-Venkatesh, Golod-Shafarevich e Hajir-Maire-Ramakrishna.”
Então, para mim, parece que o modelo conectou esses pontos com base em trabalhos anteriores que já estavam nos dados de treino
- Isso parece bastante típico em matemática
  No fim, tudo vem dos axiomas, ou então se trata de explorar as consequências de novos axiomas

GN⁺ 2026-05-21

Comentários do Hacker News

Esse tópico no HN me deixou deprimido, e ainda estou pensando no porquê
Se você tirar os elogios de release da OpenAI, há muitas questões interessantes e sutis sobre o papel dos LLMs na pesquisa matemática
Recomendo muito ler os comentários dos matemáticos que acompanham o resultado, especialmente as falas de Tim Gowers
Mas os comentários viraram um campo de batalha de debates sobre LLMs, refutações e contrarrefutações furiosas que se repetem desde 2023
Fico me perguntando se não é triste repetir a mesma briga em torno das linhas de frente traçadas há 3 anos e se estaremos nisso ainda daqui a 2 anos
- Daqui a 2 anos, aqui e todos os fóruns da internet ainda serão assim
  Pode melhorar a vida guardar no coração a famosa passagem de Nietzsche: “Não quero travar guerra contra a feiura. Não quero acusar, nem mesmo quero acusar os acusadores. Desviar o olhar deve ser minha única negação”
- As pessoas estão preocupadas com o sustento, então é uma reação natural
- Eu entendo. É comum avaliar inteligência humana e IA como uma competição de soma zero, porque os empregadores em geral entendem assim e os provedores de modelos de linguagem também divulgam dessa forma
  Quanto mais a IA demonstra capacidade, mais a balança pende numa direção desconfortável para todos que não têm segurança no emprego muito sólida
  Vai levar tempo até as pessoas reconhecerem que a IA tem um conjunto de capacidades bem diferente da inteligência humana e a complementa bastante bem
  A chance de superar a inteligência humana em larga escala é baixa, e as empresas que apostarem nisso vão ficar para trás
- Quando um lado começa a atirar pedras, o conteúdo do texto deixa de importar, e vira uma briga sobre se o texto é bom ou lixo
  Eu quero ter uma discussão de verdade sobre esses temas, mas como todo mundo acredita que só a própria realidade é real e a realidade oposta é falsa, isso continua escalando
  Às vezes percebo que venho ao HN só para ficar com raiva e dou uma longa pausa
  Não sei por que fazemos isso conosco mesmos, e no fundo acho que em geral queremos a mesma coisa
- Daqui a 2 anos não vai ser assim. Até lá, o meu lado vai ter vencido
Para o pessoal do “LLM só interpola os dados de treino”: Ayer e o Wittgenstein inicial, embora de maneiras diferentes, viam a verdade matemática como algo que não relata novos fatos sobre o mundo
A ideia de que uma prova apenas desdobra o que já está implicitamente contido em axiomas, definições, símbolos e regras é profundamente interessante, e mesmo assim não há problema em dar crédito da descoberta ao matemático
Então, ou a recombinação de material existente não é desqualificante, ou então boa parte das Fields Medals teria de ser devolvida
- Acho que a maioria dos adultos funcionais entende que a Fields Medal e quase todo “prêmio” anual é dado tanto para inovação recombinatória quanto para inovação de “pensamento em nova dimensão”
  Nem humanos produzem inovação em nova dimensão em todas as áreas todo ano
  Dá para dizer que LLMs “apenas” recombinam, mas ainda duvido que um LLM treinado em toda a literatura de álgebra, geometria e trigonometria anterior a Newton/Leibniz conseguiria inventar o cálculo
  Ainda assim, esse tipo de inovação é uma área em que LLMs são bons, e isso não significa que humanos deixem de precisar ser bons em inovação recombinatória
  Em termos de sintetizar ideias novas, ainda parece haver muita coisa que humanos conseguem fazer e LLMs não
- Podemos imaginar todos os pedaços do conhecimento humano como pontos discretos em um enorme espaço do conhecimento de alta dimensão
  Se você desenhar a grande envoltória convexa em torno de todos esses pontos, o LLM, por ter aprendido dentro dela, consegue interpolar entre pontos existentes e chegar a pontos novos, mas ainda dentro da envoltória
  Se LLMs conseguem chegar a pontos fora da envoltória ainda é discutível
  Só chegar a novos pontos dentro dela já é muito útil
  Muitas novas descobertas e provas, talvez a maioria das úteis, são desses pontos alcançáveis a partir do que já temos
  Há muitas coisas que ainda não foram descobertas apenas porque ninguém dedicou tempo e esforço a isso, e LLMs podem acelerar bastante esse processo
  Por outro lado, há pontos fora da envoltória que não são alcançáveis por extrapolação ou interpolação a partir dos pontos existentes, e exigem um salto realmente novo
  A passagem da física newtoniana para a relatividade geral me parece um caso candidato
  Demis Hassabis já falou em usar como avaliação de AGI um sistema de IA treinado só com conhecimento de física anterior a 1915, mostrar a ele a órbita de Mercúrio e ver se chega independentemente à relatividade geral
  Duvido que os LLMs atuais consigam dar esse salto, e a maioria dos humanos também não conseguiria
  Chamamos Einstein de gênio porque ele sozinho deu o salto até a relatividade geral; em humanos temos prova de existência de que isso às vezes acontece, mas com IA ainda resta ver
- A maioria das descobertas de fato é implicada pelos axiomas, mas às vezes há momentos em que, por falta de expressão melhor, dá para dizer que nova matemática é criada
  Pessoas como Descartes, Newton, Leibniz, Gauss, Euler, Ramanujan e Galois tratavam a matemática mais como arte do que como ciência
  Por exemplo, muitos acham que para resolver a Riemann Hypothesis provavelmente será preciso um novo tipo de matemática, e acho pouco provável que um LLM invente isso do nada
- Espero que estejamos quase passando da fase de avaliar as capacidades de LLMs com uma régua arbitrária de uma dimensão, com “não humano” numa ponta e “além do humano” na outra
  Isso é sem sentido e pouco relevante
  Quando o Deep Blue venceu Kasparov, nem tudo mudou, e animais e máquinas sempre foram “melhores” do que humanos em certas dimensões
  Para começo de conversa, não existe uma única régua; e, mesmo que existisse, ela não seria unidimensional nem linear, e cada régua e seus extremos mudam com o tempo
  Isso também não significa entregar a vitória aos supremacistas de IA
  LLMs são ferramentas muito úteis e vão continuar melhorando dramaticamente, mas não vão superar os humanos em todas as dimensões que algumas pessoas consideram centrais
  Não haverá um momento em que, só por ultrapassar uma lista de métricas quantificadas, a IA será universalmente reconhecida como superior aos humanos
  Porque o próprio “importante” é subjetivo
- O ponto sobre a velocidade da descoberta matemática humana é bom, mas Ayer era ruim e o Wittgenstein tardio refutou o Wittgenstein inicial
  Para a afirmação de que “já está implicitamente contido” ser verdadeira, a matemática teria de ser um sistema fechado, mas já foi provado que não é
  É possível sair da matemática usando a própria matemática, por isso foram necessários vários pinos axiomáticos, incluindo Zermelo-Fraenkel
  Na prática, não entendemos bem a vastidão daquilo que poderíamos chamar objetivamente de “matemática”, e é possível que a matemática como a percebemos seja só parte de uma matemática maior, ou esteja gravemente errada
  Não sabemos se essa matemática maior teria as mesmas propriedades fechadas e sistêmicas
Para quem usa bastante LLM para programar, isso não é tão surpreendente assim, era só questão de tempo
Matemáticos fazem novas descobertas criando e aplicando ferramentas matemáticas de novas formas
Isso envolve uma quantidade enorme de trabalho iterativo, seguindo intuição e explorando conexões
Como LLMs não têm senso do que significa “descoberta”, é difícil dizer que fazem descoberta de verdade, mas podem tentar todas as ferramentas matemáticas de forma estilo Monte Carlo em direção a um objetivo estreito, achar o que funciona e então empilhar em cima disso ou combinar melhorias
Lendo o texto, essa descoberta parece exatamente desse tipo, e o LLM foi além do resultado esperado usando uma “conexão surpreendente”
Mas sem o objetivo definido por humanos, a compreensão humana do valor do novo caminho usado pela IA e a linguagem matemática criada por humanos que permite explorar os conceitos, o resultado não tem significado
- Dizer que “sem intenção e compreensão humanas não há significado” não seria antropocentrismo?
  Por que a compreensão só vale quando é humana?
  Por que o conhecimento seria só para humanos?
  Se outra espécie resolvesse a contradição entre gravidade e mecânica quântica, isso não teria significado até nos explicar e nós entendermos?
- Há um ensaio recente, longo e interessante, escrito por um matemático sobre esse tema: https://davidbessis.substack.com/p/the-fall-of-the-theorem-e...
- Não só não é surpreendente, como sempre foi esperado. Não há diferença entre programas e provas; eles são a mesma coisa
O interessante é a forma como essa prova, ou mais precisamente refutação, encontrou um contraexemplo para a conjectura original de Erdős
Como na reação de um matemático no PDF linkado, eu diria que isso é um pouco menos interessante do que provar que a conjectura verdadeira é de fato verdadeira
Provar que uma conjectura é verdadeira exige mais construção teórica
Você precisa explicar por que aquela conjectura está correta com base numa teoria maior; num contraexemplo, basta que o modelo encontre a configuração correta com uma forma mais sofisticada de busca
Claro, essa busca não é simples e é impressionante, e foram necessários muitos passos até provar a conexão com o contraexemplo
Ainda assim, me parece mais uma ligação de ideias já existentes do que o desenvolvimento de matemática nova e profunda
Não é para diminuir esse enorme feito; acho mesmo que estamos chegando a algum lugar
É puro feeling, mas me parece que os modelos não estão longe de conseguir construir teoria o bastante para provar conjecturas mais complexas que exijam desenvolvimento de matemática nova, e que a questão é conseguir trabalhar em horizontes de tempo mais longos
- Busca de prova e busca de refutação às vezes não são tão diferentes assim
  Na maior parte dos casos, você vai roendo as bordas para simplificar o problema
  Por exemplo, para provar que algo é impossível, primeiro você mostra que só há 5 famílias de casos possíveis, e consegue provar que 4 delas são impossíveis
  Aí 80% do problema está resolvido, e encontrar um contraexemplo também fica com a busca 80% menor
  No contraexemplo, você pode fazer conjecturas e dar saltos; se der certo, tudo bem, mas numa prova não pode
  Em compensação, quando você encontra o contraexemplo, os becos sem saída que descartou normalmente ficam ocultos
- Dar mais tempo não vai fazer um LLM praticar uma matemática humana que crie números complexos, ou mesmo números comuns, do nada
  Não importa por quanto tempo você o faça combinar coisas dos dados de treino
Como já disse antes, a IA vai ganhar uma Fields Medal antes de operar um McDonald's
A parte difícil era criar o tabuleiro de xadrez da matemática, ou seja, um ambiente como Lean; agora é reconhecimento de padrões e computação
LLMs são só o começo, e logo teremos IAs matemáticas mais especializadas, parecidas com o Stockfish
- Mas isso não foi verificado em Lean
  Foi feito puramente com entrada e saída em linguagem natural e, em muitos aspectos, eu diria que é até uma demonstração interessante do ponto oposto
  A verificação entra quando você quer delegar ao computador também a checagem da prova
  No momento, essa prova foi verificada manualmente por um grupo de matemáticos da área
- A fala sobre operar um McDonald's tem uma vibe distópica que me lembra o sistema de gestão fictício “Manna” usado numa franquia de hambúrguer [0]
  Havia muita automação de “centauro reverso” ali
  O Manna tinha uma lista do que precisava ser feito a cada momento e, quando um pedido chegava no caixa, dizia aos funcionários para preparar aquela refeição
  Acompanhava centenas de tarefas como limpar banheiro, passar pano no chão, limpar mesas, varrer a calçada, descongelar pão, girar estoque, limpar janelas, e atribuía cada uma aos funcionários uma a uma
  No fim do turno, o Manna sempre dizia “acabamos por hoje. Obrigado pela ajuda”, e você tirava o headset e o colocava no carregador
  Como por 6 a 8 horas uma voz na sua cabeça dizia em detalhes minuciosos o que fazer, os primeiros minutos depois de tirar o headset eram sempre confusos, e para sair do restaurante você tinha de ligar o cérebro de novo
  [0] https://en.wikipedia.org/wiki/Manna_(novel)
- Discordo. A IA pode até fazer algo de nível Fields Medal antes de operar um McDonald's, mas acho que vai operar bem um McDonald's antes de qualquer uma dessas duas coisas
  A Fields Medal virá bem depois das duas
- A prova não foi escrita em Lean, foi escrita em inglês
  É preciso validação de especialistas humanos para checar se não é só besteira
- O “tabuleiro de xadrez” da matemática já existe há mais de 40 anos
  O Lean não tem nada de especial aqui, é quase só efeito manada
  Além disso, nem sabemos o quanto o treinamento em Lean ajudou esse modelo específico
Essa prova aplica uma ideia inesperada e sofisticada da teoria algébrica dos números a uma questão de geometria elementar
Quanto mais leio sobre resultados assim, mais sinto que boa parte da força do modelo vem de ter conhecimento prévio sobre praticamente todas as áreas possíveis e não ter dificuldade em transferi-lo para um novo domínio
A beleza potencial dessas ferramentas está em poder ajudar a romper a barreira da hiperespecialização excessiva que humanos enfrentam hoje na ciência
A hiperespecialização é importante por um lado, mas por outro limita as ferramentas e inspirações às quais uma pessoa pode ter acesso
- Observação exata e muito bem explicada
  Quanto mais hiperespecializados ficamos, mais os LLMs se tornam uma ferramenta valiosa para unir horizontes diferentes
- Parece que o conjunto total do conhecimento humano é uma espécie de inteligência coletiva
  Antes, o custo de acesso a isso era alto, mas agora não é mais
  O legal é que, se alguém contribui com algo para a inteligência coletiva, isso pode ser aplicado imediatamente a qualquer problema em que outras pessoas estejam trabalhando
- Sempre fui cético quanto ao papel dos LLMs na matemática, mas esse argumento eu nunca tinha visto e me pareceu bastante convincente
  Talvez os LLMs possam ajudar a desenvolver uma compreensão mais horizontal de um campo
- Sim. As pessoas provavelmente se concentram mais na profundidade e menos na amplitude por causa da limitação do próprio campo de visão
  Como esse é um modelo geral, ele também tem conhecimento em nível de doutorado ou mais em física, biologia, história etc.
  Acho que ainda não entendemos direito quanta coisa uma única “mente” que internalizou conhecimento de tantas áreas pode realizar
Quando a OpenAI disse que o modelo teria “inteligência de nível PhD”, todo mundo riu, e agora é interessante ver o critério mudando para conseguir criar matemática nova
Não se está pedindo nível PhD, e sim nível Leibniz, Euler ou Galois
- Mesmo assim, em programação ele ainda age como um desenvolvedor júnior que decorou o Stack Overflow inteiro
O resumo do raciocínio desse trabalho, linkado no post do blog, tem 125 páginas
É uma escala de raciocínio absurda, bem parecida com o que a Anthropic insinuava com Mythos
- Para quem tiver curiosidade, o link está aqui: https://cdn.openai.com/pdf/1625eff6-5ac1-40d8-b1db-5d5cf925d...
- Hoje, para corrigir 3 linhas faltando num modelo SQL e abrir um PR, gerei texto equivalente a dois volumes de LOTR, então +1
Fico me perguntando por que só ouvimos falar de solução para problemas de Erdős
Deve haver incontáveis problemas em aberto na matemática, mas todas as “descobertas matemáticas” do ChatGPT que vejo em r/singularity e r/accelerate são problemas de Erdős
- Problemas de Erdős representam uma parcela significativa dos problemas matemáticos explicitamente formulados, mas não resolvidos
  São famosos o bastante para chamar atenção e, ao mesmo tempo, não são interessantes o suficiente para que muita gente dedique grande esforço a eles
  Resolver um problema já formulado por outra pessoa é uma atividade de nicho na pesquisa matemática
  Mais comum é estudar algum objeto interessante, enquadrá-lo de um jeito que dê para atacar com as ferramentas disponíveis e então tentar encontrar uma solução
  No cenário ideal, tanto a formulação do problema quanto a solução se tornam interessantes por si mesmas
- Problemas de Erdős são fáceis de descrever, então viram um ótimo benchmark no primeiro ano da matemática por IA
- Pelo que sei, é porque existe uma comunidade e um banco de dados em torno deles
- Não são só problemas de Erdős: https://news.ycombinator.com/item?id=48213189
- Eles são famosos porque Erdős foi um grande matemático
  É parecido com os problemas de Hilbert de um século atrás
Sem dúvida é impressionante
Mas, sem saber com o que esse modelo foi treinado, é muito difícil julgar até que ponto ele chegou nisso “por conta própria”
A indústria inteira de IA vem pagando muito dinheiro a especialistas de várias áreas para produzir grandes volumes de novos dados de treino
São dados de treino novos, que não podem ser encontrados em lugar nenhum, e as empresas os mantêm guardados; pode até haver ideias realmente originais ali dentro
É improvável que alguém tenha simplesmente resolvido esse problema e colocado no treino, mas, sendo sincero, também não posso dizer que a OpenAI com certeza não faria isso
O mais interessante é a possibilidade de já terem produzido dados de treino que tocavam a maioria ou até todas as proposições centrais que parecem “originais” nessa prova
Claro, não dá para saber
Mas essa pergunta sempre vai permanecer até que essas coisas sejam feitas de um jeito não secreto
- Isso parece uma interpretação bem conspiratória

Modelo da OpenAI refutou uma conjectura central da geometria discreta

Avanço no problema da distância unitária

O método encontrado pela IA

O conteúdo matemático do problema da distância unitária

Por que o resultado é surpreendente

Novas técnicas vindas da teoria algébrica dos números

O significado para a matemática

Por que isso importa

Leituras relacionadas

2 comentários

Comentários no Lobste.rs

Comentários do Hacker News