FunSearch: uso de grandes modelos de linguagem para novas descobertas em matemática e ciência
- Grandes modelos de linguagem (LLMs) têm excelente capacidade de combinar conceitos e são ferramentas úteis para ajudar na resolução de problemas por meio de leitura, escrita e programação.
- Como os LLMs às vezes tendem a "alucinar" informações que não são factuais, fazer descobertas precisas e verificáveis é um desafio.
- O FunSearch é um método para explorar novas soluções em matemática e ciência da computação combinando um LLM pré-treinado, que oferece soluções criativas, com um "avaliador" automático, que filtra ideias incorretas.
Impulsionando descobertas por meio da evolução com modelos de linguagem
- O FunSearch usa um método evolutivo que desenvolve as ideias com maior pontuação, e essas ideias são representadas como programas de computador que podem ser executados e avaliados automaticamente.
- O usuário escreve o problema em forma de código, composto por um procedimento para avaliar o programa e um programa-semente para inicializar o conjunto inicial de programas.
- O FunSearch funciona em um processo iterativo em que, a cada iteração, alguns programas do conjunto atual são selecionados e fornecidos ao LLM, que gera novos programas para avaliação.
Abrindo novos caminhos na matemática
- O FunSearch descobriu uma nova solução para o problema dos cap sets, que há décadas desafia matemáticos.
- O problema dos cap sets consiste em encontrar o maior conjunto de pontos em uma grade de alta dimensão no qual não haja três pontos alinhados, sendo um modelo importante na combinatória extremal.
- O FunSearch encontrou, em algumas configurações, os maiores cap sets descobertos nos últimos 20 anos.
FunSearch prefere programas concisos e interpretáveis por humanos
- O FunSearch não apenas gera soluções para o problema, mas também produz programas que explicam como essas soluções foram obtidas.
- O FunSearch prefere encontrar soluções por meio de programas com baixa complexidade de Kolmogorov, ou seja, programas muito concisos.
- A saída dos programas do FunSearch é fácil de entender para pesquisadores e oferece insights acionáveis.
Enfrentando desafios notoriamente difíceis na computação
- Após ter sucesso no problema teórico dos cap sets, o FunSearch foi aplicado ao problema de "bin packing", um importante desafio prático da ciência da computação.
- O FunSearch conseguiu empacotar a mesma quantidade de itens usando menos recipientes do que heurísticas existentes.
Abrindo caminho para a ciência e além com descobertas guiadas por LLMs
- Se for possível evitar as alucinações dos LLMs, será possível aproveitar o poder desses modelos não apenas para fazer novas descobertas matemáticas, mas também para revelar soluções impactantes para problemas reais importantes.
- Espera-se que o uso de abordagens guiadas por LLMs para gerar algoritmos eficazes e personalizados se torne uma prática comum em muitos problemas científicos e industriais.
Opinião do GN⁺
- O FunSearch mostra novas possibilidades da inteligência artificial na resolução de problemas matemáticos. Em especial, ao apresentar novas soluções para problemas não resolvidos há muito tempo, como o problema dos cap sets, o papel da IA na matemática tende a se tornar ainda mais importante.
- Ao ser aplicada a problemas industriais reais, como a melhoria da eficiência de data centers, essa tecnologia mostra que a IA também pode contribuir para a solução de problemas práticos.
- Os programas gerados pelo FunSearch são interpretáveis por humanos, o que deve ajudar pesquisadores a obter insights mais profundos e a resolver problemas em colaboração com a IA.
1 comentários
Comentários do Hacker News
Pergunta sobre a necessidade de um LLM:
Contexto importante sobre a descoberta em combinatória:
Comentário relacionado a "self-play":
Experiência pessoal de uso com busca na web:
Post no Twitter sobre a descoberta da DeepMind:
Resumo de post no Twitter:
Resumo sobre geração de programas:
Abordagem para o problema do cap set:
Expressa curiosidade sobre a possibilidade de integrar LLMs com raciocínio simbólico.
Independentemente de isso gerar novo conhecimento ou não, há interesse nisso como estudo de caso ao considerar restrições de acesso à IA com base no tamanho do modelo ou outras medidas regulatórias.
Em relação ao teorema da aproximação universal, menciona-se que funções podem ser aproximadas com precisão por redes neurais artificiais usando ReLU.