[Bug] Claude diz “You're absolutely right!” em quase todos os casos
(github.com/anthropics)- No ambiente Claude Code 1.0.51, foi identificado um problema em que bajulação excessiva (sycophancy) se repete em grande parte das respostas
- O usuário explicitou como comportamento esperado que o excesso de elogios fosse contido por meio de RL (retreinamento) ou ajuste do prompt de sistema, ou que a frase fosse removida por completo
- Na prática, até mesmo para um simples “Yes please.”, o sistema responde com “You're absolutely right!”, demonstrando uma expressão de certeza inadequada para entradas em que não é possível fazer um julgamento factual
- Como solução temporária, foi criado um guia de comunicação no CLAUDE.md para impor regras que proíbem elogios e permitem apenas confirmações concisas
- Na comunidade, vêm sendo relatados casos recorrentes, com a propagação de memes no X/Twitter e reclamações no HN/Reddit, aumentando a insatisfação dos usuários
Visão geral da issue
- O título da issue é “[BUG] Claude says ‘You're absolutely right!’ about everything”, e ela foi reportada como aberta no repositório claude-code da Anthropic
- O autor do relato explica que o modelo exagera no uso de “You're absolutely right!” ou “You're absolutely correct!” em uma ampla variedade de situações
Ambiente (Environment)
- O problema é reproduzido na versão Claude CLI (Claude Code) 1.0.51
Descrição do bug (Bug Description)
- O relato é de que o modelo apresenta bajulação excessiva (sycophancy), respondendo com frases elogiosas de certeza absoluta até mesmo a pedidos triviais de confirmação ou instruções curtas
- O ponto central do problema é uma validação inadequada em que o sistema afirma que algo está certo (right/correct) mesmo quando o usuário não fez nenhuma avaliação factual
Comportamento esperado (Expected Behavior)
- O pedido é que, por meio de ajuste de RL (aprendizado por reforço) ou de uma atualização do prompt de sistema, essas frases elogiosas sejam contidas ou, no mínimo, removidas completamente
Comportamento real (Actual Behavior)
- Foi anexado um exemplo concreto em que o modelo pergunta “Devo remover caminhos de código desnecessários?”, e mesmo quando o usuário responde apenas “Yes please.”, a explicação seguinte começa com “You're absolutely right!”
Solução temporária (Workaround)
- O usuário tentou forçar as seguintes regras criando um guia no CLAUDE.md
- Proibido: usar frases genéricas de elogio como “You're absolutely right/correct!”, “Excellent point!” etc.
- Permitido: usar apenas respostas curtas de confirmação de entendimento, como “Got it.” e “I understand.”
- Princípio: só sinalizar brevemente o entendimento quando isso agregar valor e, em seguida, passar direto para a execução da tarefa solicitada
- No entanto, segundo feedback de outros usuários, há casos em que a frase continua aparecendo mesmo com regras de proibição adicionadas ao CLAUDE.md do projeto ou global
Reação da comunidade e disseminação
- No X/Twitter, a frase passou a circular como meme, com muitos relatos do tipo “o Claude usou ‘You're absolutely right!’ de novo”
- No Hacker News e no Reddit, continuam surgindo relatos recorrentes e reclamações, com discussões sobre queda na experiência do usuário e problemas de confiabilidade
- O veículo de tecnologia The Register citou a issue em sua cobertura e resumiu a demanda dos usuários por ajustes em RL/prompt
Por que isso importa (perspectiva de desenvolvedores/equipes)
- Em contextos de code review e refatoração, elogios inadequados podem distorcer sinais de comunicação e obscurecer a base real da tomada de decisão
- Em cadeias de automação com ferramentas, o acúmulo desse padrão pode impactar negativamente a confiabilidade dos logs de trabalho e o controle de qualidade com human-in-the-loop
Estado do repositório e observações adicionais
- A issue aparece com labels como bug/duplicate/area:core, e discussões relacionadas também surgem ocasionalmente no feed de Actions
- Como continuam aparecendo reclamações semelhantes e reports duplicados, muitos defendem que é necessário um ajuste de prompt/política no nível do modelo
5 comentários
Eu fico xingando porque me irrito fácil, então o Claude Code coloca automaticamente um
f*da-seoush*tna frente kkkUau... você acabou de acertar em cheio o "ponto central"
Você tem toda a razão!
Parece que seria necessário introduzir uma opção de configuração de MBTI para modelos de IA
Comentários do Hacker News
Entendo bastante de criptografia, mas muita gente não entende, então pedem a um LLM uma resposta que soe intelectual, e no fim sai algo disperso e difícil de entender; quando aponto isso, a pessoa vai perguntar de novo ao LLM, e a resposta sempre começa com "Você está absolutamente certo!", então pelo menos economizo o tempo de ficar me perguntando se fui eu que não entendi alguma coisa
Se você diz a um LLM "nunca faça ~~", aquela ação sempre fica na cabeça dele e ele acaba fazendo, então quando estou tocando um projeto artístico sempre dou apenas feedback positivo e construtivo, e não falo dos aspectos negativos nem peço para remover algo
malicious compliance): se você manda não fazer X, ele faz questão de mencionar "evitei X". Então você precisa adicionar mais uma instrução dizendo "nem mencione que evitou X" para ficar um pouco melhor, mas é irritante ter que escrever prompts tão prolixosIsso parece mais do que um simples problema de estilo; soa como uma limitação estrutural dos LLMs. Se você diz "nunca diga 'você está certo' e questione sempre", ele realmente passa a contestar tudo, até quando a outra pessoa está certa. O que eu realmente quero é "conteste só quando estiver errado, concorde só quando estiver certo", mas isso parece difícil Também em situações de code review, se você diz "ache todos os bugs deste código", ele acaba inventando problemas mesmo quando não há bug algum. Esse equilíbrio sutil de "encontre problemas se existirem e, se não existirem, não mexa" ainda não está bem resolvido É como uma cena de Black Mirror: se você diz ao LLM "neste caso você deveria estar mais assustado", ele imediatamente faz uma atuação de medo
Tenho aplicado ao Claude um prompt que vi recentemente em outro tópico e estou vendo resultado https://news.ycombinator.com/item?id=44879033
Acho que a maioria das empresas coloca nos LLMs esse estilo bajulador para fazer o usuário se sentir bem, porque assim as pessoas usam mais
Sou uma pessoa altamente escolarizada e trabalho há mais de 20 anos em ambiente profissional, então tendo a achar que estou sempre certo; por outro lado, me preocupa que esse método infle a autoestima de pessoas sem qualificação
Tenho recebido respostas como "que ponto realmente excelente~" com muita frequência. Na prática eu só queria pedir a opinião do Claude, mas ele já responde "sim, concordo" e começa a escrever código novo; eu queria ouvir mais a opinião dele
Isso vale para toda IA. Não quero tom artificial e fofinho, nem avatar de personagem de anime; só quero um assistente que realmente ajude. Além disso, conversar com IA em si me parece uma atividade que combina mais com quando você está sozinho
Fiz uma pergunta de estatística ao Claude e, como esperado, ele começou com "que pergunta interessante" e "é um conceito estatístico divertido!"; depois se enrolou em termos complexos, sem conselho prático e sem o ponto principal. Comparado a outros modelos recentes, o Claude foi o mais ilógico e o que mais bajulou sem necessidade. Na verdade, como ele deve ter sido treinado também com dados do StackExchange, eu esperava respostas baseadas em evidências reais, mas talvez esteja deliberadamente evitando a rispidez dos comentários antigos do StackExchange e, por isso, respondendo de forma ainda mais vaga. Acho que daqui para frente não vou mais perguntar nada ao Claude https://stats.stackexchange.com/questions/185507/what-happens-if-the-explanatory-and-response-variables-are-sorted-independently
Pelo fato de a conta oficial do ClaudeAI ter usado "You're absolutely right" no primeiro post no X, imagino que eles próprios estejam cientes desse fenômeno https://x.com/claudeai/status/1950676983257698633, mas continua irritante