- Tentei usar codificação com agentes, mas a discrepância entre o que vejo online e os resultados que consigo implementar na prática está me dando dor de cabeça; existe alguma evidência de que isso realmente traz resultados positivos?
- Além do marketing exagerado, se alguém aqui já implementou com sucesso programação agêntica, por favor compartilhe em detalhes como fez
- "Implementar com sucesso" significa algo como
- gerar mais valor do que dívida técnica
- escrever código estruturalmente sólido a ponto de um responsável pela arquitetura poder aprová-lo
- Recentemente, tenho visto uma tendência de minimizar ou até eliminar code review, com o argumento de que é preciso passar da "validação da arquitetura" para a "validação do funcionamento"
- Na prática, isso parece significar implantar se passar nos testes e no CI, sem olhar o código, e tenho dúvidas se esse modelo é sustentável no longo prazo
- Na minha opinião, usar Codex tende a produzir código que funciona nos caminhos normais, mas que com o tempo vira "código espaguete" com erros sutis e difíceis de depurar se acumulando
- Quando tentei aplicar o Codex a uma base de código existente, com ou sem diretrizes definidas, metade do meu tempo foi gasta corrigindo erros sutis ou código duplicado gerado pelo Codex
- No último fim de semana, tentei recriar do zero um app iOS de lembrete de ração para pets
- Pedi ao Codex que primeiro pesquisasse e sugerisse um blueprint de arquitetura baseado em SwiftUI, e escrevi junto com ele uma especificação explicando o que implementar e como
- A primeira implementação tinha alguns bugs, mas estava surpreendentemente boa; depois disso, porém, a situação piorou rapidamente
- Passei o restante do fim de semana tentando fazer o Codex funcionar direito, corrigir bugs sem criar novos e pesquisar boas práticas em vez de sair escrevendo código aleatoriamente
- Fiz com que o Codex registrasse novas diretrizes sempre que fossem descobertas, mas a situação não melhorou, e no fim desisti
- Pessoalmente, considero inaceitável implantar código não revisado
- Algo parece estar errado. O produto precisa funcionar corretamente, mas a qualidade do código também precisa ser alta
1 comentários
Opiniões do Hacker News
Há muito dinheiro em jogo, já que os LLMs são vistos como a chave para reduzir custos
Influenciadores e até especialistas famosos às vezes fazem declarações exageradas para manter uma imagem de “estado da arte”
Mas, na prática, ainda não existe uma melhor abordagem consolidada para desenvolvimento com LLMs
Neste momento, em vez de acreditar nisso como se fosse uma fé, acho mais importante olhar diretamente para como as coisas funcionam por dentro
O fato de esse tipo de proposta chegar até a usuários aleatórios indica que já existe uma campanha de marketing considerável em andamento
São divertidos para tarefas CRUD simples, mas em projetos complexos acabam gerando mais frustração
Agora é um momento em que a disputa por benchmarks e o dinheiro de VC estão concentrados no tema, o que dificulta uma discussão equilibrada
Ainda faltam evidências quantitativas, mas mesmo que os desenvolvedores não desapareçam por completo, a forma de desenvolver mudou para sempre
Um Principal Engineer do Google tuitou que “Claude Code fez em 1 hora um trabalho que levaria 1 ano”
Mas depois ficou claro que o que a IA produziu era apenas uma “versão de brinquedo”
Esse tipo de exagero distorce as expectativas e provoca decepção
Link do tuíte relacionado
Olhando para os últimos 6 meses, consegui um ganho de eficiência de 10x com código de infraestrutura (ex.: Terraform)
Mas o desenvolvimento de funcionalidades especializadas ainda é inconsistente
Mesmo assim, o tempo economizado por reduzir tarefas repetitivas permitiu melhorar a qualidade de testes e segurança
Acima de tudo, voltei a sentir prazer em programar
Link do projeto
Acho que esse tipo de projeto pessoal é o verdadeiro game changer
Tive muito sucesso ao acoplar agentes a um app já existente
Os agentes são fracos em arquitetura, mas funcionam muito bem em código que já está estruturado
Quanto mais rigoroso o sistema de tipos e maior a cobertura de testes, melhor o resultado
O trabalho segue ROADMAP.md, TASKS.md e STATUS.md escritos pelo Claude, e surpreendentemente já está cerca de 20% concluído
Já Python e JS são difíceis de confiar por causa do sistema de tipos mais fraco
Criar tudo do zero é difícil, mas com uma especificação clara a eficiência aumenta
Já a tipagem opcional do Python acaba causando propagação de erros
Escrevi 100% com Claude Code um monitor de frequência cardíaca Bluetooth em tempo real para Linux
Link do projeto
Foi feito em C puro, com interface web e gráficos em tempo real, tudo concluído em um dia
Desta vez consegui implementar com sucesso a comunicação dBus–blueZ que antes tinha falhado
A documentação diz SSE, mas internamente ele só retorna uma resposta HTTP comum
Eu uso Augment + Claude Opus 4.5 todos os dias
Quase não escrevo código diretamente; concluo projetos com um fluxo iterativo baseado em especificações
Rodar vários agentes em paralelo e revisar o resultado é especialmente eficiente
O segredo está em escrever especificações claras e dar feedback por etapas
Sinto que é a mudança mais revolucionária dos meus 30 anos de carreira, e tenho certeza de que isso vai transformar toda a indústria
No momento estou usando Claude em um projeto de dicionário japonês–inglês
Link do GitHub, site
Como desenvolvedor com 20 anos de experiência, os LLMs fizeram minhas previsões de velocidade de trabalho errarem completamente
O que antes levava 2 semanas agora termina em 2 dias
Ainda é preciso revisar o código e interagir com o processo, mas sinto que ele é melhor do que a maioria dos desenvolvedores humanos
Conversar com um LLM se parece mais com colaborar com um desenvolvedor sênior, e a minha longa experiência em revisão de código e distribuição de tarefas ajuda muito
O método mais estável que usei até agora é passar tarefas pequenas e claras para o Claude
Vou repetindo o ciclo de planejar, revisar, implementar e revisar de novo
Não é perfeito, mas é muito útil para destravar pontos onde se fica preso
Como ele não segue bem as diretrizes, verificação e organização manuais são indispensáveis
Entrego uma função por vez e, olhando o resultado, consigo chegar a ideias melhores
Mas, quando o problema passa a ser centrado em design, as limitações ficam evidentes
CLAUDE.mdMuita gente entende errado a programação assistida por IA
A IA não é um colega de equipe, e sim uma assistente
O ponto central não é tratar bugs ou mau funcionamento como fracasso, mas entender que o essencial é o processo de um desenvolvedor experiente organizar esse caos
Eu também uso Claude todos os dias, mas o código de teste gerado por IA costuma ser uma bagunça
Na prática, ela produz em massa testes sem sentido como
expect(true).to.be(true)Se você pede implementação e testes ao mesmo tempo, surgem erros de autocorreção/autovalidação