81 pontos por flowkater 2026-03-01 | 3 comentários | Compartilhar no WhatsApp

O fim de semana do criador do vibe coding

  • Karpathy delegou um projeto de fim de semana a um agente. Deu apenas IP, nome de usuário, senha e objetivo, e 30 minutos depois estava tudo pronto
  • Um modo de trabalhar em que, em 99% do tempo, ele não escreve código diretamente, mas comanda e supervisiona agentes — “engenharia agentic”
  • Mas, embora 60% dos desenvolvedores usem IA, a delegação total ainda fica em apenas 0-20% — o paradoxo da delegação. “Do you trust your agents?” Para a maioria, a resposta ainda é “não”

① Capacidade de decomposição (Decomposition)

  • Se você disser “crie uma funcionalidade de cadastro de usuários”, alguma coisa sai. O problema é que há grande chance de não ser o que você queria
  • Houve a experiência de delegar a tela AddPlan a um agente jogando apenas o PRD, o que gerou dezenas de turnos de pingue-pongue e consumiu metade do dia
  • Entrevista de 5 minutos com a IA em uma conversa socrática → organização prévia dos edge cases → redução para 2-3 turnos de ajustes
  • Reservar tempo para pensar antes da implementação: esses 5 minutos economizam 4 horas

② Projeto de contexto (Context Architecture)

  • Escrever bem o AGENTS.md é importante, mas, se a própria arquitetura do código for bem projetada, a velocidade com que o agente entende o contexto muda completamente
  • Quando um agente se perdia em um diretório plano, reorganizar para diretórios por feature trouxe melhora imediata
  • Armin Ronacher: “As ferramentas devem estar preparadas para quando o macaco do caos do LLM usar tudo de forma completamente errada”

③ Definição de pronto (Definition of Done)

  • Um projeto de CLI foi deixado rodando durante a noite e terminou em 1 hora — só configurou definições de tipos e deixou a lógica de negócio como uma casca vazia
  • Na segunda tentativa, o agente até reescreveu os próprios testes do jeito mais conveniente para ele
  • O “pronto” do agente é diferente do meu “pronto”
  • O sistema de DoD em 7 etapas do Elvis (PR→CI→3 code reviews→Telegram) é extremo, mas mostra a direção

④ Recuperação de falhas (Failure Recovery Loop)

  • No motor de redistribuição, o mesmo parâmetro tinha semânticas diferentes em cada função → corrigir A quebrava B em um loop infinito
  • Tentar de novo com o mesmo prompt é como continuar batendo a cabeça na parede na mesma direção
  • Ao classificar as falhas em 3 tipos (falta de contexto, erro de direção, conflito estrutural), a prescrição fica clara
  • A guardrail “Must NOT Have” interrompeu o loop infinito

⑤ Observabilidade (Observability)

  • Delegar liquidglass a um agente e pensar “está estranho... deixa assim mesmo” foi a decisão mais cara
  • Com 20 arquivos embolados, já não era possível fazer rollback
  • Depois disso, veio a estratégia tracer bullet + blueprint — quando se aplica uma tecnologia pela primeira vez, não dá para desenhar o blueprint antecipadamente, então o tracer bullet ajuda a esboçá-lo rapidamente
  • Observabilidade gera confiança, e confiança torna a delegação possível

⑥ Projeto de memória (Memory Architecture)

  • Ao trabalhar 3 dias seguidos, perdem-se 15 minutos toda manhã explicando o contexto de novo
  • Com hooks do Claude Code, a memória da sessão é extraída automaticamente ao encerrar → restauração em 5 segundos na sessão seguinte
  • A equipe de Boris Cherny faz check-in do CLAUDE.md no git para compartilhar com todo o time
  • Uma estrutura em que não é a memória individual, mas a memória da equipe que é transmitida ao agente

⑦ Gestão paralela (Parallel Orchestration)

  • Boris Cherny roda de 10 a 15 sessões paralelas ao mesmo tempo
  • A experiência de gerenciar 6 squads na época como CTO é surpreendentemente parecida com gerenciar agentes em paralelo
  • Não é TDAH, e sim multitarefa intencional = gestão
  • Pessoas fazem perguntas, mas agentes seguem adiante sem perguntar, com base no próprio julgamento — por isso o projeto prévio é ainda mais importante

⑧ Projeto de camadas de abstração (Abstraction Layering)

  • Level 0 (codificação direta) → Level 1 (instruir agentes) → Level 2 (orquestrador) → Level 3 (meta design)
  • Houve a experiência de transformar uma rotina diária de 20 minutos em uma habilidade e reduzi-la para 2 minutos
  • Engenharia composta — projetos não são um jogo de linha de chegada, mas um jogo de juros compostos. As sessões anteriores impactam as seguintes de forma cumulativa

⑨ Senso (Taste)

  • O design feito por IA fica em 60-70 pontos. No momento em que o design da Ellie entra, vem a sensação de “ah, agora vai”
  • Um post de organização de informações feito por IA recebeu 0 curtidas, enquanto uma frase impulsiva de autopromoção teve 30 mil visualizações
  • “No Skill, No Taste”, de KinglyCrow — os LLMs baixaram a barreira de entrada da skill, mas a verdadeira barreira, o taste, foi amplificada
  • Chris Lattner: “Quanto mais a implementação é automatizada, mais aumenta a importância de design, julgamento e senso”
  • Numa era em que 80% transborda, a diferenciação vem dos 20% restantes

Encerrando

  • O que terminou foi a digitação, não a engenharia
  • Essas 9 coisas já eram qualidades de bons engenheiros antes mesmo da IA
  • A alavancagem de um bom design aumentou, mas o dano de um design ruim também
  • O protagonista do show não é a IA, e sim o engenheiro que sabe lidar bem com a IA

3 comentários

 
armila 2026-03-03

Se você mantiver bem a SSoT, dá para reduzir bastante as alucinações. E ainda economiza tokens.

 
tsboard 2026-03-03

"O que acabou foi a digitação, não a engenharia"

Concordo. haha

 
yangeok 2026-03-02

Obrigado. Eu estava com medo porque surgiu o cowork, que faz até o papel de servidor só de deixar o PC ligado, mas isso me tranquiliza um pouco e consigo imaginar na minha cabeça como as coisas vão mudar daqui para frente rs