2 pontos por ragingwind 7 시간 전 | Ainda não há comentários. | Compartilhar no WhatsApp

Das mãos que escrevem código à visão para projetar sistemas

A O'Reilly realizará em 26 de março a terceira AI Codecon com o tema "O artesanato do software na era da IA". Os anfitriões do evento, Tim O'Reilly e Addy Osmani, colocam de frente a pergunta sobre o que a palavra "artesanato" significa numa era em que agentes escrevem uma parte significativa do código. A frase de Steve Yegge, "código é líquido. Você borrifa com uma mangueira; não fica olhando para ele", e o caso de Wes McKinney, criador do pandas, que produz código consumindo mais de 10 bilhões de tokens por mês em Go, uma linguagem que ele nunca programou manualmente, formam o pano de fundo deste evento.

O campo da dark factory

  • Conceito: expressão que faz analogia com fábricas robóticas sem operadores, onde nem é preciso deixar as luzes acesas, e que aponta para um ambiente de produção de software em que humanos apenas definem a direção e os agentes assumem a maior parte da implementação.
  • Antfarm, de Ryan Carson: ferramenta open source que instala com um único comando uma equipe inteira de agentes no OpenClaw. Um agente de planejamento decompõe pedidos de funcionalidade em user stories, e agentes separados implementam e testam cada história em ambientes isolados, devolvendo PRs (pull requests) validados.
  • Automação da revisão humana: no pipeline de CI (integração contínua), agentes gravam em vídeo o uso direto da funcionalidade e anexam isso ao PR. O papel humano deixa de ser produzir e passa a ser revisar.
  • Ponto de limite: também será discutido o fato de que, quando agentes falham ou o loop de feedback se rompe, surgem áreas que não se resolvem apenas com novas tentativas automáticas.

O campo em que artesanato significa supervisão

  • Padrão de orquestração de Addy Osmani: a apresentação "Orchestrating Coding Agents" cobre um espectro que vai do fundador solo que roda centenas de sessões sem olhar o código até equipes enterprise que precisam de quality gates e manutenção de longo prazo. A posição aqui é que o necessário não é uma ferramenta, mas um "padrão".
  • Engenharia de contexto: conceito batizado por Andrej Karpathy para a técnica de estruturar informações de forma que LLMs operem com estabilidade. Também é o tema central do novo livro de Osmani, Beyond Vibe Coding.
  • A visão de Cat Wu, da Anthropic: como responsável de produto por Claude Code e Cowork, ela busca uma direção em que humanos permaneçam naturalmente dentro do loop por meio de sistemas confiáveis, interpretáveis e controláveis (reliable, interpretable, steerable). Isso contrasta com Carson, que mira a autonomia máxima.

A linha que trata o custo das falhas

  • Nicole Koenigstein: em sua apresentação "o custo oculto das falhas de agentes", ela analisa modos de falha que não aparecem em demos, mas explodem em produção. Ela é autora do novo livro da O'Reilly AI Agents: The Definitive Guide.
  • Hila Fox (Qodo): compartilha o caminho real de evolução de ferramentas baseadas em prompts simples para sistemas multiagentes prontos para produção, além dos problemas que surgem nesse processo.
  • Advait Patel (Broadcom SRE): aborda casos reais de resposta quando agentes de IA quebraram sistemas de produção.
  • Abhimanyu Anand (Elastic): levanta a pergunta "será que seu eval está mentindo para você?" e alerta para o risco de construir sistemas sobre frameworks de avaliação equivocados.

A tese de que o gargalo não são as mãos, mas a visão

  • Mythical Agent-Month: Wes McKinney aplica aos agentes a proposição clássica de Fred Brooks de que "adicionar mais gente a um projeto atrasado o atrasa ainda mais". Agentes não reduzem a complexidade essencial e, ao contrário, passam a produzir complexidade acidental na velocidade das máquinas.
  • Barreira brownfield: a observação é que, por volta da escala de 100 mil linhas de código, agentes começam a sufocar no código inchado que eles mesmos criaram.
  • Gosto (taste) como recurso escasso: com a limitação de trabalho diminuindo, a capacidade de manter na cabeça a consistência conceitual de um sistema e decidir o que construir e o que remover passa a ser o diferencial decisivo. A conclusão é que sobreviverá não quem rodar mais sessões em paralelo, mas quem conseguir manter na mente o modelo conceitual do projeto.

Novas organizações e arquiteturas

  • AI Flower, de Juliette van der Laarse: arquitetura pública de competências para engenharia AI-native, tratando de como organizações de engenharia devem realocar capacidades em um ambiente onde agentes assumem a maior parte da codificação.
  • Automação vs. ampliação, de Mike Amundsen: automação substitui trabalho humano, enquanto ampliação potencializa a expertise humana. A distinção entre as duas, segundo ele, determinará a forma futura da economia humano-IA.
  • Tatiana Botskina (Oxford): trata da colaboração entre agentes e do problema de rastreamento de proveniência (provenance), ou seja, como verificar a origem dos artefatos produzidos por agentes.
  • Neethu Elizabeth Simon (Arm): aborda a questão fundamental de confiabilidade dos testes de servidores MCP (Model Context Protocol). Isso se torna mais importante à medida que o MCP se firma como estrutura padrão de conexão entre sistemas de agentes.
  • Arushee Garg (LinkedIn): compartilha um caso de sistema multiagente em produção para gerar mensagens de outreach.

Perspectiva enterprise

  • Fireside chat com Aaron Levie, CEO da Box: a tese é que agentes não substituem o software enterprise; eles operam por cima dele, e para funcionar precisam de conteúdo, contexto e governança.
  • Libertação do trabalho latente: é a visão de que a IA destrava tarefas como análise de contratos ou otimização de processos, que empresas não conseguiam atacar por causa do custo.
  • Reavaliação do julgamento humano: quanto mais orientado por agentes for o ambiente, menos o entendimento contextual e a governança humana perdem valor; na verdade, mais eles ganham importância.
  • A preocupação de Tim O'Reilly: também se levanta o problema de que a IA pode criar enorme valor enquanto corrói o ciclo econômico da expertise humana que a sustenta.

Contrastes entre campos

  • Carson vs. Cat Wu: o embate entre a busca por autonomia máxima e uma filosofia de design que preserve naturalmente a supervisão humana.
  • McKinney vs. Osmani: chegam à mesma conclusão — de que gosto e julgamento de design importam — por caminhos diferentes, um a partir da perspectiva do desenvolvedor individual e o outro da perspectiva de equipes de centenas de pessoas.
  • Entusiasmo e cautela: Koenigstein e Fox recolocam a pergunta que o otimismo de outras apresentações tende a encobrir: "o que acontece quando dá errado?"

De modo geral, o texto transmite a mensagem de que o artesanato do software não está desaparecendo, mas migrando. O centro de gravidade se desloca de digitar código para projetar sistemas, da luta heroica individual para a orquestração de múltiplos agentes, da habilidade manual para gosto e julgamento. Tomando emprestada a expressão de Steve Yegge, Tim O'Reilly encerra perguntando se estamos no fim da programação como ofício ou no ponto de partida de um novo ofício, e conclui que os desenvolvedores que entenderem primeiro essa transição terão a maior vantagem.

Ainda não há comentários.

Ainda não há comentários.