2 pontos por GN⁺ 2025-01-12 | Ainda não há comentários. | Compartilhar no WhatsApp
  • Avanços dos LLMs para raciocínio System 2

    • Pesquisadores, incluindo Violet Xiang, propõem uma nova estrutura chamada Meta Chain-of-Thought (Meta-CoT)
    • O Meta-CoT expande o Chain-of-Thought (CoT) existente ao modelar explicitamente o raciocínio fundamental necessário para chegar a um determinado CoT
    • Apresenta evidências empíricas de comportamentos alinhados com busca em contexto nos modelos mais recentes e explora métodos de geração de Meta-CoT por meio de supervisão de processo, geração de dados sintéticos e algoritmos de busca
  • Geração de Meta-CoT e pipeline de treinamento

    • Apresenta um pipeline de treinamento concreto para gerar Meta-CoT
    • Inclui como treinar o modelo por meio de ajuste por instrução com rastros de busca linearizados e aprendizado por reforço
  • Questões em aberto da pesquisa

    • Discute várias questões de pesquisa, como leis de escala, o papel dos verificadores e a possibilidade de descobrir novos algoritmos de raciocínio
    • Este estudo fornece um roadmap teórico e prático para viabilizar Meta-CoT em LLMs, possibilitando um raciocínio em inteligência artificial mais poderoso e mais semelhante ao humano

Ainda não há comentários.

Ainda não há comentários.