Introdução ao mathstodon.xyz
- mathstodon.xyz é parte de uma rede social descentralizada baseada em Mastodon, sendo uma instância para usuários ligados à matemática.
- Suporta renderização de LaTeX na interface web.
- Administrador: Christian Lawson-Perfect (@christianp)
- Estatísticas do servidor: 3 mil usuários ativos
Experimentos de Terence Tao com o GPT-o1
- GPT-o1: nova versão do GPT da OpenAI que realiza uma etapa inicial de raciocínio antes da execução do LLM.
- Experimento 1: em respostas a uma pergunta matemática ambígua, identificou corretamente o teorema de Cramér e forneceu uma resposta satisfatória.
- Em versões anteriores, conceitos relacionados eram mencionados, mas os detalhes estavam errados.
- Experimento 2: ao enfrentar um problema complexo de análise, chegou à solução correta com muitas dicas e condução, mas não conseguiu gerar sozinho a principal ideia conceitual e cometeu alguns erros.
- Houve melhora em relação ao modelo anterior, mas ainda é insuficiente.
- Com mais algumas melhorias no futuro, pode vir a ser útil para trabalho em nível de pesquisa.
- Experimento 3: na tarefa de formalizar resultados em Lean, compreendeu bem o problema e fez bem a decomposição inicial, mas havia vários erros no código devido à falta de informações atualizadas sobre Lean.
- Pode ser muito útil em uma IDE integrada com modelos especializados em Lean e Mathlib.
Discussão adicional
- Avanço das ferramentas de IA: há expectativa pelo surgimento de um ecossistema de ferramentas de IA capaz de lidar com diversas tarefas de pesquisa.
- Atualmente, os grandes LLMs de uso geral recebem mais atenção, mas espera-se que modelos leves e open source ajustados para aplicações específicas também tenham um papel importante.
- Comparação entre IA e estudantes de pós-graduação: discussão sobre se ferramentas de IA podem contribuir em nível de estudantes de pós-graduação.
- No momento, ainda exigem mais esforço do que um pós-graduando, mas há possibilidade de que essa proporção caia para 1 ou menos nos próximos anos.
# Resumo do GN⁺
- Terence Tao testou o novo modelo GPT-o1 da OpenAI para avaliar sua capacidade de resolver problemas matemáticos.
- O GPT-o1 melhorou em relação às versões anteriores, mas ainda tem algumas limitações.
- Com mais algumas melhorias no futuro, pode vir a ser útil para trabalho em nível de pesquisa.
- Há expectativa pelo surgimento de um ecossistema de várias ferramentas de IA para apoiar tarefas de pesquisa.
- Atualmente, os grandes LLMs de uso geral recebem atenção, mas espera-se que modelos leves e open source ajustados para aplicações específicas também tenham um papel importante.
1 comentários
Comentários no Hacker News
Há expectativa de que, se o GPT for ajustado no Lean (assistente de provas) como foi no Python, ele se torne mais útil para matemática em nível de pesquisa
Imagine voltar para 2019 e ler que a experiência de interagir com a Alexa era "parecida com orientar um pós-graduando mediano, mas não totalmente incompetente"
O modelo o1 é muito impressionante
As experiências com o modelo O1 variam muito
A novidade é que o LLM, em vários temas, é "parecido com orientar um pós-graduando mediano, mas não totalmente incompetente"
Humanos também podem se beneficiar de um tipo de raciocínio de "cadeia de pensamento"
Concorda com a opinião de Terence Tao
Há expectativa em voltar a estudar matemática como hobby independente
A opinião de Terence Tao é surpreendente
Daniel Litt ficou impressionado com o o1-preview, mas ainda não teve sorte ao resolver problemas matemáticos interessantes