1 pontos por GN⁺ 2025-04-30 | 1 comentários | Compartilhar no WhatsApp
  • CoRT é um algoritmo que faz o modelo de IA revisar repetidamente a própria resposta e gerar alternativas para selecionar a melhor resposta
  • Quando aplicado ao modelo Mistral 3.1 24B, o desempenho melhorou bastante, especialmente em tarefas de programação
  • A IA gera uma resposta inicial e, por meio de várias 'rodadas de pensamento', avalia alternativas para escolher a resposta final
  • Esse processo inclui autoavaliação, geração competitiva de alternativas, melhoria iterativa e profundidade de raciocínio dinâmica
  • CoRT é disponibilizado sob a licença MIT, e contribuições para melhorias são bem-vindas

CoRT (Chain of Recursive Thoughts) 🧠🔄

Resumo

  • Apresenta o CoRT, um algoritmo que faz a IA debater consigo mesma para encontrar respostas melhores
  • O modelo de IA revisa repetidamente suas respostas e gera alternativas para selecionar a melhor resposta
  • Quando aplicado ao modelo Mistral 3.1 24B, o desempenho melhorou bastante, especialmente em tarefas de programação

Como o CoRT funciona

  • A IA gera uma resposta inicial
  • A IA determina quantas 'rodadas de pensamento' são necessárias
  • Em cada rodada:
    • Gera 3 respostas alternativas
    • Avalia todas as respostas
    • Seleciona a melhor resposta
  • A resposta final se torna a sobrevivente deste battle royale de IA

O ingrediente secreto

  • Autoavaliação
  • Geração competitiva de alternativas
  • Melhoria iterativa
  • Profundidade de raciocínio dinâmica

Contribuição

  • Se você encontrou uma forma de melhorar, PRs são bem-vindos

Licença

  • Pode ser usado livremente sob a licença MIT

1 comentários

 
GN⁺ 2025-04-30
Opiniões no Hacker News
  • Faz o modelo de chat de IA apresentar uma resposta para um problema e depois escrever um relatório explicando por que essa resposta está correta

    • Um segundo modelo de IA avalia esse relatório e escreve outro relatório apontando informações que o modelo original não forneceu ou inconsistências lógicas
    • Esse processo é repetido até que o segundo modelo de IA fique satisfeito com a explicação do primeiro, ou até que o primeiro modelo implemente todas as mudanças solicitadas
    • Esse método é um pouco complexo, mas quando foi testado trouxe resultados bem bons
  • Gostaria de tentar um debate de “senado” em maior escala, em um modo sempre ativo

    • Em vez de responder a problemas individuais, fornece-se uma lista de tarefas e o senado passa a resolvê-las
    • Acredita que seria possível obter resultados impressionantes com diferentes perspectivas e análise crítica
    • Exige muitos tokens, mas como o custo por token está caindo cada vez mais, parece viável
    • Também existe a possibilidade de criar um servidor IRC dedicado a IA para formar um espaço de debate compartilhado onde qualquer pessoa possa conectar seu próprio modelo
  • Como estratégia simples, ao encerrar a mensagem pede: "pense uma vez com a tag de pensamento, faça uma autocrítica uma vez com a tag de crítica e, por fim, pense mais uma vez com a tag de pensamento antes de responder"

    • Funciona bem
    • Também é eficaz pedir para encontrar os 5 maiores problemas da proposta
  • É diferente do que se esperava pelo título

    • Define papéis como assistente, verificador cruzado e juiz, e conduz perguntas e respostas de acordo com cada papel
    • Pede ao ChatGPT: "explique se XYZ for verdadeiro" e "explique se XYZ não for verdadeiro", para encontrar o lado mais convincente
  • Está projetando um editor de grafos no estilo Blueprint do Unreal Engine para que vários agentes executem tarefas a partir da entrada do usuário

    • Os modelos Mistral small 3.1 e gemma 3 parecem os primeiros modelos semi-capazes que conseguem rodar localmente
    • Ao tentar execução de Python em loop e instruí-lo a explorar o mundo, ele começa a baixar e ler notícias etc.
  • Fica a dúvida se equipes de agentes de IA vão operar um time scrum e fazer reuniões de stand-up a cada poucas horas

    • Fica a dúvida se a burocracia governamental será replicada com agentes debatendo tópicos o dia inteiro para chegar à melhor opinião
  • Como forma de fazer modelos de ML gerarem novas ideias, aborda diagonalmente ideias que já foram tentadas e descartadas, mantendo ao mesmo tempo certas restrições de consistência

  • Se não fizermos uma transição rápida de todas as GPUs para energia verde, a Terra vai esquentar enquanto a IA discute sozinha para encontrar a solução ideal

  • Há exemplos usando CoRT e exemplos sem usar, e os que não usam são muito melhores

    • Escolha de exemplos estranha
  • Essa abordagem lembra criadores de conteúdo do YouTube

    • Fazem um script do jogo como se fosse uma pista de corrida para alcançar o ponto de objetivo, e repetem até encontrar a solução mais rápida
    • Chamam isso de aprendizado de máquina ou aprendizado por reforço
    • O entendimento leigo sobre IA costuma ser mais ou menos assim