Como fazer code review na era da IA?
(flowkater.io)- Ensaio que, a partir da experiência de um CTO com 15 anos de carreira, organiza o debate sobre code review na era da IA em tese-antítese-síntese
- Code review sempre foi um problema — faltavam tempo, pessoas e processo
- A IA fez o volume de código produzido explodir, mas a capacidade de revisão permaneceu a mesma → o gargalo ficou ainda maior
Tese — a revisão humana é indispensável
- Simon Willison: "não empurre para seus colaboradores um código que você não revisou"
- Kent Beck: quanto mais o custo de geração se aproxima de zero, mais o valor migra da geração para a verificação
- Addy Osmani: "o problema não resolvido não é a geração, e sim a verificação"
- Por melhor que a IA seja, a responsabilidade continua sendo humana → é preciso verificar → é preciso revisar
Antítese — o fim da era da revisão humana
- Bryan Finster: aplicação do teorema de Nyquist-Shannon — se só a frequência de produção aumenta e a frequência de feedback permanece igual, haverá falhas sistemáticas
- Dados da SmartBear: acima de 400 linhas, a taxa de detecção de defeitos despenca; a IA gera 600 linhas de uma vez
- StrongDM, "fábrica de software": humanos não escrevem nem leem código. Apenas definem intenções e fazem a curadoria de cenários
- Stanford CodeX: "se agentes criam e testam, em quem podemos confiar?"
- Salesforce Prizm: o próprio modelo de revisão centrado em diff não funciona na era da IA → reconstrução da intenção
Síntese — o que deve ser revisado
- latent.space: code review → intent review (revisão de intenção)
- A especificação é a fonte da verdade; o código é o artefato resultante
- Construir confiança em 5 camadas (modelo do queijo suíço)
- Padrão Qodo: contexto em primeiro lugar, baseado em severidade, revisão por agentes especialistas
- Bryan Finster: os únicos bloqueios humanos são conhecimento insuficiente + caminho regulatório
Conclusão
- O autor não revisa diretamente o código gerado por IA → faz a transição para o papel de QA
- Engenheiro nativo de IA = precisa assumir por conta própria o papel de PM de eras anteriores
- "Você consegue se responsabilizar pelo seu código?"
4 comentários
https://app.devin.ai/review
Ainda não sei se isso vai acabar sendo só mais um método passageiro, como os erros de ponto intermediário,
mas estou compartilhando uma ferramenta que permite entender o código e corrigir bugs enquanto faz review de PR com IA.
Eu a uso em projetos paralelos quando não consigo entender as alterações de código feitas pela IA.
Falácia do meio-termo (
argument to moderation): quando existem duas afirmações extremas (A e Z), trata-se da lógica de concluir, sem justificativa, que o ponto intermediário (M) será a verdade ou a melhor solução.Do ponto de vista do grupo contrário, a revisão humana acaba sendo o gargalo.
Acho que metade e metade ainda é algo irrealista por enquanto. O código continua sendo usado, e como os LLMs são probabilísticos, a pessoa ainda precisa ler todo o código que escreveu. Para facilitar a revisão, ainda há necessidade de usar um template automático para o PR ou registrar em ADR para entender contexto e intenção.