3 pontos por GN⁺ 2025-06-17 | 1 comentários | Compartilhar no WhatsApp
  • Apresenta uma visão sobre a possibilidade de acesso à inteligência artificial geral (AGI) por meio do Claude Code
  • Compartilha as impressões do autor a partir de sessões reais de código com o Claude
  • Destaca o nível alcançado pelo Claude em capacidade de programação, conhecimento amplo e criatividade
  • Menciona que a capacidade de entender contexto e interpretar código do Claude o diferencia das ferramentas atuais
  • Projeta os impactos técnicos na forma de desenvolver e utilizar inteligência artificial

Introdução

  • Este texto reúne as reflexões do autor sobre a aproximação da inteligência artificial geral em nível humano (AGI) a partir da experiência de programar com o Claude Code
  • Entre as ferramentas recentes de IA conversacional, o autor sentiu um forte choque e entusiasmo com os resultados mostrados pelo Claude

Experiência de sessão de programação com o Claude

  • O Claude consegue resolver solicitações complexas de programação de forma rápida e criativa
  • Além de cálculos simples ou tarefas repetitivas, ele consegue entender a essência do problema e propor novas abordagens
  • O autor pediu ao Claude tarefas de alta complexidade, como otimização, melhoria de estrutura e refatoração de código, e ficou profundamente impressionado com a qualidade dos resultados
  • O Claude demonstrou compreensão de contexto superior à dos LLMs anteriores, chegando a captar até a intenção do código

O diferencial do Claude Code

  • Diferentemente das IAs conversacionais em geral, o Claude pode ir além de escrever código e assumir papéis de um desenvolvedor humano, como entender a estrutura completa do projeto, fazer revisão de código e explicar intenções de longo prazo
  • Ele também consegue fornecer explicações detalhadas, escrever testes e se adaptar a diferentes linguagens de programação e paradigmas
  • Mostra uma capacidade proativa ao identificar erros lógicos no código e sugerir direções de melhoria

Percepção sobre o limiar da AGI

  • Após a experiência com o Claude Code, o autor passou a ter uma nova convicção sobre a possibilidade de alcançar uma AGI mais próxima da realidade
  • Ele prevê que a mudança de um modelo em que humanos criam software diretamente para um ambiente de desenvolvimento liderado por IA deve se tornar realidade em breve

Conclusão e perspectivas

  • O Claude Code não é apenas mais uma ferramenta de IA, mas mostra potencial para transformar o próprio paradigma de uso de IA
  • No futuro, humanos e IA deverão projetar e implementar programas juntos, formando uma cultura de desenvolvimento de software ainda mais inovadora

1 comentários

 
GN⁺ 2025-06-17
Comentários do Hacker News
  • Achei o artigo realmente excelente, e também venho compartilhando experiências e técnicas parecidas; na prática, tenho sentido a eficiência de usar o Claude Code para lidar rapidamente com várias tarefas ao mesmo tempo. Sobre a parte de "sub agents", o Claude Code já resolveu inúmeros problemas para mim ao chamar o o3 via sigoden/aichat, especialmente em questões como race conditions, caça a bugs e outros problemas que exigem contexto e alta capacidade de raciocínio. Dito isso, desde o lançamento do Opus 4, passei a usar isso com menos frequência. Compartilho aqui o prompt que uso e um link de referência: advanced_ai.md, além do link do sigoden/aichat: sigoden/aichat
  • Ao ver last_week.md, sinceramente achei muito difícil de ler. O texto é prolixo demais e parece documento de PR, o que me faz questionar a confiabilidade do estilo de escrita desses resumos por IA. Acabo achando melhor olhar diretamente o log de commits. Na maioria dos casos, textos resumidos por IA têm um estilo ruim, e a confiabilidade da informação também continua insatisfatória. No fim, muitas vezes ler o original diretamente é mais rápido e mais eficiente.
    • Senti a mesma confusão e frustração com onboarding. Em vez do método tradicional de sentar com um colega e aprender a codebase, sou cético em relação a um futuro em que só lemos slides gerados por IA. Não é um futuro que eu queira.
    • Compartilho o system prompt que uso com frequência: peço concisão, permito termos técnicos e oriento a evitar marketing vazio ou formulações vagas. Também enfatizo que o usuário deve ser tratado como alguém tecnicamente experiente. Isso não elimina completamente as alucinações, mas ajuda a tornar mais legíveis as respostas da IA para programação ou perguntas técnicas.
    • Também vale lembrar que dá para especificar no prompt o estilo desejado. Tive a impressão, de forma meio bem-humorada, de que o autor do artigo prefere um estilo prolixo, tipo PR.
    • Já em "What happened here was more than just code..." eu perdi a vontade de continuar lendo.
    • Isso relembra o antigo bug do Sycophant: fazer o usuário se sentir bem pode ser um fator importante para que a IA pareça inteligente ou que a experiência pareça boa. Fico na dúvida se o objetivo do reinforcement learning da IA é precisão, maximização de interação, ou se essas duas coisas entram em conflito.
  • Na minha opinião, o exemplo usado para explicar o borrow checker do Rust é péssimo como demonstração de capacidade de leitura de código. Afinal, esse conteúdo já está amplamente presente nos dados de treino.
    • Concordo. Se você pedir para explicar como exceções são tratadas em tasks do asyncio no Python, a IA oscila de forma inconsistente, como o pior estagiário possível. E como nem consegue continuar aprendendo, isso parece desperdício. Se até tarefas importantes, mas relativamente simples, são assim, então é só perda de tempo.
  • Sou favorável a automatizar scripting com um agente open source agnóstico de LLM. Essa tecnologia está mudando a base do desenvolvimento de software, então precisamos continuar controlando a forma como trabalhamos. openhands
    • Parece um ótimo recurso. Também vale mencionar modelos fortes que conseguem rodar numa Nvidia 4090 (24GB RAM), como Devstral e Queen 3. O Ollama tornou muito mais fácil rodar isso no próprio hardware, mas o custo de GPU é alto. Ainda assim, se você já está pagando US$ 250 por mês em um serviço, pode recuperar o investimento rapidamente montando sua própria estrutura.
    • Isso levanta a pergunta fundamental: e se os modelos fechados forem realmente melhores em termos de qualidade?
    • Concordo 10000%.
  • Estranho não haver nenhuma menção ao Opus. Depois de testar vários modelos, usei o Claude Code com o plano Anthropic "Max" de US$ 100/mês e percebi que o Opus 4 é o modelo premium ideal para matemática, código e pesquisa. Depois de bater no limite da sessão de 5 horas, mudei para a API e gastei US$ 20 em uma hora. No fim, fiz upgrade para o plano "Max" inferior de US$ 200/mês e desde então tenho usado sem limite e com bons resultados. Isso me fez perceber como a escolha do modelo realmente importa; até pequenas diferenças, no estilo "encontrei alguém não muito esperto", podem ter um peso enorme.
  • O terminal realmente me parece uma interface perfeita para LLMs. Fico pensando se, no futuro, essa abordagem pode se tornar mais comum do que integrações com IDEs customizadas.
    • Na prática, a interface de terminal permite acesso a todo o sistema. Com o claude code, por exemplo, dá para inspecionar um banco com conta somente leitura, abrir um navegador com puppeteer para verificar mudanças de CSS, depurar cluster k8s e até consultar a API do prometheus. Estou muito satisfeito com isso.
    • Imagino um futuro em que deixamos a LLM tentar 5 correções diferentes em paralelo para economizar tempo humano. Se essa forma de trabalho se espalhar, talvez passemos a rodar vários contêineres em paralelo, e a vantagem da interface de terminal pode acabar ficando relativamente menor.
    • Eu, por outro lado, acho o terminal a pior interface possível. A desvantagem é não conseguir editar diretamente o código gerado.
    • Se os modelos continuarem evoluindo, talvez a IDE passe a parecer uma ferramenta de baixo nível.
  • Considero foco em detalhes um sinal importante de capricho de uma equipe, então se os termos de uso da Anthropic são tão contraditórios que se tornam impraticáveis, isso me faz duvidar se é um parceiro confiável. A cláusula que proíbe uso competitivo torna inviável usar isso no trabalho, o que parece bem distante de algo "three laws safe".
    • Não posso opinar sobre o jurídico, mas o produto Claude Code em si demonstra um cuidado enorme com os detalhes. Até o uso de haiku em cada contexto para mostrar verbos bonitinhos e apropriados no indicador de “working...” revela esse capricho.
  • Feedback de que o contraste entre o fundo e o texto na página é baixo, o que dificulta a leitura.
    • No meu caso, o cursor piscando no topo já é suficiente para atrapalhar a concentração.
    • Sinceramente, você pode simplesmente pular o conteúdo sem grande prejuízo real.
  • Também concordo com a sensação de que o Claude Code parece mais poderoso que o Cursor. O Claude Code é mais do que um editor de código; eu o uso de várias formas até dentro do meu vault do Obsidian, incluindo key bindings customizados, upload automático de capturas, geração de links para CDN e criação de programas para resumir comandos de terminal. Antes eu pensava muito sobre a fronteira entre scripts de automação e trabalho manual, mas agora deixo o Claude cuidar de tudo isso de uma vez e estou satisfeito.
    • O problema é que o Claude Code só pode ser usado por assinantes do plano. Não está disponível via API, e fico em dúvida se US$ 100/mês realmente basta. Ainda assim, parece uma ferramenta valiosa o suficiente para usar o dia inteiro.
    • Tenho curiosidade de ouvir mais sobre os casos de uso concretos no Obsidian Vault.
    • Já pedi para uma LLM classificar uma quantidade enorme de notas em pastas por categoria, e funcionou muito bem.
  • Sobre o comentário de que o openai codex em breve será reescrito em Rust, a reação meio em tom de piada foi: se a IA é tão boa assim, então por que a própria IA precisaria fazer o rewrite?