- CoRT é um algoritmo que faz o modelo de IA revisar repetidamente a própria resposta e gerar alternativas para selecionar a melhor resposta
- Quando aplicado ao modelo Mistral 3.1 24B, o desempenho melhorou bastante, especialmente em tarefas de programação
- A IA gera uma resposta inicial e, por meio de várias 'rodadas de pensamento', avalia alternativas para escolher a resposta final
- Esse processo inclui autoavaliação, geração competitiva de alternativas, melhoria iterativa e profundidade de raciocínio dinâmica
- CoRT é disponibilizado sob a licença MIT, e contribuições para melhorias são bem-vindas
CoRT (Chain of Recursive Thoughts) 🧠🔄
Resumo
- Apresenta o CoRT, um algoritmo que faz a IA debater consigo mesma para encontrar respostas melhores
- O modelo de IA revisa repetidamente suas respostas e gera alternativas para selecionar a melhor resposta
- Quando aplicado ao modelo Mistral 3.1 24B, o desempenho melhorou bastante, especialmente em tarefas de programação
Como o CoRT funciona
- A IA gera uma resposta inicial
- A IA determina quantas 'rodadas de pensamento' são necessárias
- Em cada rodada:
- Gera 3 respostas alternativas
- Avalia todas as respostas
- Seleciona a melhor resposta
- A resposta final se torna a sobrevivente deste battle royale de IA
O ingrediente secreto
- Autoavaliação
- Geração competitiva de alternativas
- Melhoria iterativa
- Profundidade de raciocínio dinâmica
Contribuição
- Se você encontrou uma forma de melhorar, PRs são bem-vindos
Licença
- Pode ser usado livremente sob a licença MIT
1 comentários
Opiniões no Hacker News
Faz o modelo de chat de IA apresentar uma resposta para um problema e depois escrever um relatório explicando por que essa resposta está correta
Gostaria de tentar um debate de “senado” em maior escala, em um modo sempre ativo
Como estratégia simples, ao encerrar a mensagem pede: "pense uma vez com a tag de pensamento, faça uma autocrítica uma vez com a tag de crítica e, por fim, pense mais uma vez com a tag de pensamento antes de responder"
É diferente do que se esperava pelo título
Está projetando um editor de grafos no estilo Blueprint do Unreal Engine para que vários agentes executem tarefas a partir da entrada do usuário
Fica a dúvida se equipes de agentes de IA vão operar um time scrum e fazer reuniões de stand-up a cada poucas horas
Como forma de fazer modelos de ML gerarem novas ideias, aborda diagonalmente ideias que já foram tentadas e descartadas, mantendo ao mesmo tempo certas restrições de consistência
Se não fizermos uma transição rápida de todas as GPUs para energia verde, a Terra vai esquentar enquanto a IA discute sozinha para encontrar a solução ideal
Há exemplos usando CoRT e exemplos sem usar, e os que não usam são muito melhores
Essa abordagem lembra criadores de conteúdo do YouTube