36 pontos por GN⁺ 2026-03-10 | 8 comentários | Compartilhar no WhatsApp
  • O recurso de Code Review, que mobiliza uma equipe de múltiplos agentes em cada PR para detectar em profundidade bugs que humanos tendem a deixar passar, foi lançado em research preview
  • Como a produção de código dos engenheiros da Anthropic aumentou 200% no último ano, a revisão de código virou um gargalo, e muitos PRs passaram a receber apenas uma passada de olhos em vez de uma revisão profunda
  • Antes da adoção, apenas 16% dos PRs recebiam comentários de revisão realmente substanciais; depois, esse número subiu para 54%, embora a aprovação do PR continue sendo responsabilidade humana
  • Em PRs grandes (mais de 1.000 linhas), 84% incluem achados, com média de 7,5 problemas reportados, e a taxa de falso positivo fica abaixo de 1%
  • O custo da revisão fica, em média, em torno de US$ 15–25 por PR com base no uso de tokens, e há recursos de controle de custos como limite mensal por organização e controle por repositório

O gargalo da revisão de código

  • Como a produção de código por engenheiro na Anthropic aumentou 200% no último ano, a revisão de código emergiu como gargalo no processo de desenvolvimento
  • Clientes também relatavam o mesmo problema semanalmente: com desenvolvedores sobrecarregados, muitos PRs acabavam recebendo uma passada de olhos em vez de uma revisão profunda
  • Foi desenvolvido como uma opção mais rigorosa e mais cara do que a solução open source Claude Code GitHub Action, com o objetivo de colocar um revisor confiável em todos os PRs
  • Antes da adoção, apenas 16% dos PRs recebiam comentários de revisão substanciais, mas depois esse número subiu para 54%
  • A aprovação do PR continua sendo responsabilidade humana, e o recurso serve para reduzir a lacuna para que revisores consigam cobrir adequadamente o código que realmente vai para produção

Como funciona

  • Quando um PR é aberto, uma equipe de agentes é despachada para procurar bugs em paralelo
  • Cada agente valida bugs para filtrar falsos positivos e classifica os achados por gravidade
  • Os resultados são entregues no PR em um único comentário de visão geral de alto sinal e em comentários inline sobre bugs específicos
  • A escala da revisão é ajustada automaticamente conforme o tamanho do PR: mudanças grandes e complexas recebem mais agentes e análise mais profunda, enquanto mudanças triviais passam por um fluxo mais leve
  • No benchmark, o tempo médio de revisão foi de cerca de 20 minutos

Casos reais de uso

  • Após vários meses de uso interno, em PRs grandes (mais de 1.000 linhas), 84% continham achados, com média de 7,5 problemas reportados
  • Em PRs pequenos (menos de 50 linhas), 31% continham achados, com média de 0,5 problema reportado
  • Em geral, os engenheiros concordaram com os achados, e a proporção marcada como falso positivo ficou abaixo de 1%
  • Em um caso, uma alteração de uma linha em um serviço de produção era o tipo de diff que normalmente receberia aprovação rápida, mas o Code Review a sinalizou como crítica
    • A mudança tinha um modo de falha que poderia quebrar a autenticação do serviço; no diff, era fácil ler e passar batido, mas, uma vez apontado, o problema ficava evidente
    • Foi corrigida antes do merge, e o engenheiro compartilhou que sozinho não teria percebido o problema
  • No middleware open source do TrueNAS, em um PR de refatoração de criptografia do ZFS, o Code Review encontrou um bug pré-existente em código adjacente
    • Um problema de incompatibilidade de tipo que apagava silenciosamente o cache de chaves de criptografia a cada sincronização
    • Era um problema latente no código tocado pelo PR, do tipo que um revisor humano analisando o conjunto de mudanças dificilmente procuraria de imediato

Custos e controles

  • Otimizado para profundidade, ele custa mais do que soluções leves como Claude Code GitHub Action
  • As revisões são cobradas com base no uso de tokens e custam em média US$ 15–25 conforme o tamanho e a complexidade do PR
  • Opções de controle de custo e uso para administradores:
    • Limite mensal por organização: define o gasto mensal total em todas as revisões
    • Controle por repositório: ativa a revisão apenas nos repositórios selecionados
    • Painel de análise: acompanha número de PRs revisados, taxa de aceitação e custo total das revisões

Como começar

  • Disponível em formato de research preview (beta) para os planos Team e Enterprise
  • Administradores podem ativar o Code Review nas configurações do Claude Code, instalar o GitHub App e depois selecionar os repositórios em que a revisão será executada
  • Depois de ativado, para novos PRs a revisão é executada automaticamente, sem necessidade de configuração adicional pelos desenvolvedores

8 comentários

 
xguru 2026-03-10

Ultimamente, a velocidade de lançamentos da Anthropic está insana.

Ao melhorar as ferramentas de desenvolvimento, parece que eles concluíram a montagem de um flywheel que também acelera o próprio desenvolvimento interno.

Dá muito a sensação de startup despejando alguma novidade todo dia.

Deve estar estimulando bastante a OpenAI.

 
heycalmdown 2026-03-10

Dá para ver que eles estão trabalhando de um jeito muito divertido.

 
bluekai17 2026-03-11

Se o custo diminuísse, acho que seria ótimo.

 
princox 2026-03-11

Gerando código com o Claude e revisando código com o Claude...

 
tested 2026-03-10

Pelo visto, o plano individual não é compatível. Será que nem mais para a frente vai ser?

 
mammal 2026-03-10

Parece que a melhoria recursiva começou.

 
zihado 2026-03-10

gente, sendo bem sincero, vocês do Claude não estão rápidos demais...? buáá

 
botplaysdice 2026-03-11

Claude: porque não é humano.... né;;;;