Geas - Fazendo com que agentes de IA sigam protocolos de trabalho rígidos para não cometer erros
(github.com/choam2426)Olá, sou um pesquisador júnior de segurança que usa muito o Claude code no trabalho.
Contexto
Era mais um dia trabalhando com Claude code, como de costume.
Como eu precisava fazer uma tarefa grande e importante, dediquei muito esforço para fazê-lo entender o trabalho e montar um plano.
Depois de muita discussão, fiz com que ele criasse um arquivo de plano e fizesse uma auto-revisão, e aí ele encontrou muitos problemas críticos.
Como eu tinha investido bastante na preparação, fiquei obcecado com a ideia de “perfeito... preciso de um plano perfeito...”, então comecei um ciclo infinito de auto-revisão, pedindo que continuasse revisando até que não surgissem mais problemas.
No entanto, mesmo após 17 auto-revisões, os problemas não desapareceram, e ele chegou ao ponto de criar coisas novas além do escopo definido no início, incluindo alterações desnecessárias.
Enquanto minha cabeça latejava, começaram a passar pela minha mente vários conhecimentos soltos sobre IA que eu tinha visto no GeekNews, em newsletters e afins: “tendência a se superestimar”, “fica preguiçoso quando o trabalho se prolonga”, “middle in the lost” e por aí vai... E foi assim que passei a enxergar o Claude como uma espécie de personalidade e cheguei à conclusão: “Claude é um gênio preguiçoso”.
Foi com a mentalidade de “como posso pressionar esse gênio preguiçoso a dar 100% o tempo todo?” e “se eu quero ficar preguiçoso, eles precisam ser diligentes” que este projeto começou.
Atualmente, o projeto é composto por duas partes.
- protocolo
- plugin do Claude code que faz com que ele siga o protocolo
Gostaria de saber a opinião de quem já passou pela mesma preocupação.
Ainda não há comentários.