O artesanato do software na era da IA
(oreilly.com)Das mãos que escrevem código à visão para projetar sistemas
A O'Reilly realizará em 26 de março a terceira AI Codecon com o tema "O artesanato do software na era da IA". Os anfitriões do evento, Tim O'Reilly e Addy Osmani, colocam de frente a pergunta sobre o que a palavra "artesanato" significa numa era em que agentes escrevem uma parte significativa do código. A frase de Steve Yegge, "código é líquido. Você borrifa com uma mangueira; não fica olhando para ele", e o caso de Wes McKinney, criador do pandas, que produz código consumindo mais de 10 bilhões de tokens por mês em Go, uma linguagem que ele nunca programou manualmente, formam o pano de fundo deste evento.
O campo da dark factory
- Conceito: expressão que faz analogia com fábricas robóticas sem operadores, onde nem é preciso deixar as luzes acesas, e que aponta para um ambiente de produção de software em que humanos apenas definem a direção e os agentes assumem a maior parte da implementação.
- Antfarm, de Ryan Carson: ferramenta open source que instala com um único comando uma equipe inteira de agentes no OpenClaw. Um agente de planejamento decompõe pedidos de funcionalidade em user stories, e agentes separados implementam e testam cada história em ambientes isolados, devolvendo PRs (pull requests) validados.
- Automação da revisão humana: no pipeline de CI (integração contínua), agentes gravam em vídeo o uso direto da funcionalidade e anexam isso ao PR. O papel humano deixa de ser produzir e passa a ser revisar.
- Ponto de limite: também será discutido o fato de que, quando agentes falham ou o loop de feedback se rompe, surgem áreas que não se resolvem apenas com novas tentativas automáticas.
O campo em que artesanato significa supervisão
- Padrão de orquestração de Addy Osmani: a apresentação "Orchestrating Coding Agents" cobre um espectro que vai do fundador solo que roda centenas de sessões sem olhar o código até equipes enterprise que precisam de quality gates e manutenção de longo prazo. A posição aqui é que o necessário não é uma ferramenta, mas um "padrão".
- Engenharia de contexto: conceito batizado por Andrej Karpathy para a técnica de estruturar informações de forma que LLMs operem com estabilidade. Também é o tema central do novo livro de Osmani, Beyond Vibe Coding.
- A visão de Cat Wu, da Anthropic: como responsável de produto por Claude Code e Cowork, ela busca uma direção em que humanos permaneçam naturalmente dentro do loop por meio de sistemas confiáveis, interpretáveis e controláveis (
reliable, interpretable, steerable). Isso contrasta com Carson, que mira a autonomia máxima.
A linha que trata o custo das falhas
- Nicole Koenigstein: em sua apresentação "o custo oculto das falhas de agentes", ela analisa modos de falha que não aparecem em demos, mas explodem em produção. Ela é autora do novo livro da O'Reilly AI Agents: The Definitive Guide.
- Hila Fox (Qodo): compartilha o caminho real de evolução de ferramentas baseadas em prompts simples para sistemas multiagentes prontos para produção, além dos problemas que surgem nesse processo.
- Advait Patel (Broadcom SRE): aborda casos reais de resposta quando agentes de IA quebraram sistemas de produção.
- Abhimanyu Anand (Elastic): levanta a pergunta "será que seu eval está mentindo para você?" e alerta para o risco de construir sistemas sobre frameworks de avaliação equivocados.
A tese de que o gargalo não são as mãos, mas a visão
- Mythical Agent-Month: Wes McKinney aplica aos agentes a proposição clássica de Fred Brooks de que "adicionar mais gente a um projeto atrasado o atrasa ainda mais". Agentes não reduzem a complexidade essencial e, ao contrário, passam a produzir complexidade acidental na velocidade das máquinas.
- Barreira brownfield: a observação é que, por volta da escala de 100 mil linhas de código, agentes começam a sufocar no código inchado que eles mesmos criaram.
- Gosto (
taste) como recurso escasso: com a limitação de trabalho diminuindo, a capacidade de manter na cabeça a consistência conceitual de um sistema e decidir o que construir e o que remover passa a ser o diferencial decisivo. A conclusão é que sobreviverá não quem rodar mais sessões em paralelo, mas quem conseguir manter na mente o modelo conceitual do projeto.
Novas organizações e arquiteturas
- AI Flower, de Juliette van der Laarse: arquitetura pública de competências para engenharia AI-native, tratando de como organizações de engenharia devem realocar capacidades em um ambiente onde agentes assumem a maior parte da codificação.
- Automação vs. ampliação, de Mike Amundsen: automação substitui trabalho humano, enquanto ampliação potencializa a expertise humana. A distinção entre as duas, segundo ele, determinará a forma futura da economia humano-IA.
- Tatiana Botskina (Oxford): trata da colaboração entre agentes e do problema de rastreamento de proveniência (
provenance), ou seja, como verificar a origem dos artefatos produzidos por agentes. - Neethu Elizabeth Simon (Arm): aborda a questão fundamental de confiabilidade dos testes de servidores MCP (Model Context Protocol). Isso se torna mais importante à medida que o MCP se firma como estrutura padrão de conexão entre sistemas de agentes.
- Arushee Garg (LinkedIn): compartilha um caso de sistema multiagente em produção para gerar mensagens de outreach.
Perspectiva enterprise
- Fireside chat com Aaron Levie, CEO da Box: a tese é que agentes não substituem o software enterprise; eles operam por cima dele, e para funcionar precisam de conteúdo, contexto e governança.
- Libertação do trabalho latente: é a visão de que a IA destrava tarefas como análise de contratos ou otimização de processos, que empresas não conseguiam atacar por causa do custo.
- Reavaliação do julgamento humano: quanto mais orientado por agentes for o ambiente, menos o entendimento contextual e a governança humana perdem valor; na verdade, mais eles ganham importância.
- A preocupação de Tim O'Reilly: também se levanta o problema de que a IA pode criar enorme valor enquanto corrói o ciclo econômico da expertise humana que a sustenta.
Contrastes entre campos
- Carson vs. Cat Wu: o embate entre a busca por autonomia máxima e uma filosofia de design que preserve naturalmente a supervisão humana.
- McKinney vs. Osmani: chegam à mesma conclusão — de que gosto e julgamento de design importam — por caminhos diferentes, um a partir da perspectiva do desenvolvedor individual e o outro da perspectiva de equipes de centenas de pessoas.
- Entusiasmo e cautela: Koenigstein e Fox recolocam a pergunta que o otimismo de outras apresentações tende a encobrir: "o que acontece quando dá errado?"
De modo geral, o texto transmite a mensagem de que o artesanato do software não está desaparecendo, mas migrando. O centro de gravidade se desloca de digitar código para projetar sistemas, da luta heroica individual para a orquestração de múltiplos agentes, da habilidade manual para gosto e julgamento. Tomando emprestada a expressão de Steve Yegge, Tim O'Reilly encerra perguntando se estamos no fim da programação como ofício ou no ponto de partida de um novo ofício, e conclui que os desenvolvedores que entenderem primeiro essa transição terão a maior vantagem.
Ainda não há comentários.