Inalando a AGI com o Claude Code

(kadekillary.work)

3 pontos por GN⁺ 2025-06-17 | 1 comentários | Compartilhar no WhatsApp

Apresenta uma visão sobre a possibilidade de acesso à inteligência artificial geral (AGI) por meio do Claude Code
Compartilha as impressões do autor a partir de sessões reais de código com o Claude
Destaca o nível alcançado pelo Claude em capacidade de programação, conhecimento amplo e criatividade
Menciona que a capacidade de entender contexto e interpretar código do Claude o diferencia das ferramentas atuais
Projeta os impactos técnicos na forma de desenvolver e utilizar inteligência artificial

Introdução

Este texto reúne as reflexões do autor sobre a aproximação da inteligência artificial geral em nível humano (AGI) a partir da experiência de programar com o Claude Code
Entre as ferramentas recentes de IA conversacional, o autor sentiu um forte choque e entusiasmo com os resultados mostrados pelo Claude

Experiência de sessão de programação com o Claude

O Claude consegue resolver solicitações complexas de programação de forma rápida e criativa
Além de cálculos simples ou tarefas repetitivas, ele consegue entender a essência do problema e propor novas abordagens
O autor pediu ao Claude tarefas de alta complexidade, como otimização, melhoria de estrutura e refatoração de código, e ficou profundamente impressionado com a qualidade dos resultados
O Claude demonstrou compreensão de contexto superior à dos LLMs anteriores, chegando a captar até a intenção do código

O diferencial do Claude Code

Diferentemente das IAs conversacionais em geral, o Claude pode ir além de escrever código e assumir papéis de um desenvolvedor humano, como entender a estrutura completa do projeto, fazer revisão de código e explicar intenções de longo prazo
Ele também consegue fornecer explicações detalhadas, escrever testes e se adaptar a diferentes linguagens de programação e paradigmas
Mostra uma capacidade proativa ao identificar erros lógicos no código e sugerir direções de melhoria

Percepção sobre o limiar da AGI

Após a experiência com o Claude Code, o autor passou a ter uma nova convicção sobre a possibilidade de alcançar uma AGI mais próxima da realidade
Ele prevê que a mudança de um modelo em que humanos criam software diretamente para um ambiente de desenvolvimento liderado por IA deve se tornar realidade em breve

Conclusão e perspectivas

O Claude Code não é apenas mais uma ferramenta de IA, mas mostra potencial para transformar o próprio paradigma de uso de IA
No futuro, humanos e IA deverão projetar e implementar programas juntos, formando uma cultura de desenvolvimento de software ainda mais inovadora

1 comentários

GN⁺ 2025-06-17

Opiniões no Hacker News

Tenho um viés, mas [0], acho que deveríamos criar scripts em torno de agentes open source que não fiquem presos a um LLM específico
Essa tecnologia está mudando a base do desenvolvimento de software, então precisamos garantir que continuemos no controle da forma como trabalhamos

[0] https://github.com/all-hands-ai/openhands
- Parece um bom material. Há modelos bem poderosos que rodam em uma Nvidia 4090 24GB, e também há Devstral e Qwen 3
  Com Ollama, dá para rodar facilmente no seu próprio hardware, mas o custo da GPU é um investimento grande. Ainda assim, se você está pagando US$ 250 por mês por ferramentas proprietárias, consegue recuperar o investimento bem rápido
- E se os modelos fechados simplesmente forem melhores?
O texto é meio disperso. Para começar, um slide deck não é tão útil assim para explicar uma base de código
Há um motivo para as pessoas quase não usarem slide decks fora do papel de apoio a apresentações orais. A maior parte do que aparece no texto não é uma capacidade nova, e automatização de workflows certamente é valiosa e legal, mas não entendo o que AGI tem a ver com isso aqui
- Além disso, não inspira confiança. Acho que o texto também fala um pouco disso; eu só passei os olhos
  Você não deveria precisar de um LLM para entender uma base de código. Basta torná-la mais fácil de entender. Claro, o capital gosta de atalhos e gambiarras para lançar a próxima funcionalidade no Q3
- O caso nº 1 em que LLMs foram mais úteis para mim foi criar diagramas mermaidjs do código
  Sei que nem sempre fica perfeito, mas várias vezes ficou “bom o suficiente”, e nesse caso nunca vi alucinação, só omissões. Quando vejo algo faltando, também é muito fácil pedir para corrigir
- Pelo tom do texto, parece que AGI está sendo usado meio como piada, e a pessoa não se leva tão a sério, o que é refrescante
  Claro que não seria refrescante se o texto não tivesse informação útil, mas acho que slide decks podem, de fato, ser úteis para entender uma base de código. É algo “bom de ter”, no qual eu não gostaria de gastar o tempo de um júnior, mas se por uns US$ 5 sai um resultado um pouco útil, está bem interessante
  Parte da mudança de mentalidade ao usar LLMs é voltar a considerar coisas de que antes não gostávamos porque o esforço era grande demais em relação ao valor. Se eu não preciso fazer pessoalmente nem queimar o tempo e a saúde mental de alguém da equipe, passo a dizer: “beleza, dê uma olhada na base de código e escreva todas as funcionalidades e requisitos em um documento Markdown em formato de tabela. Pode sair melhor do que o esperado; se não, faço outra coisa”
Bom texto. Tenho observações e técnicas parecidas, e Claude Code é excepcionalmente bom
Hoje em dia, graças ao git worktree, passo a maior parte dos dias tocando várias coisas ao mesmo tempo, e cada uma delas ficou muito mais rápida do que antes, a ponto de ser realmente estranho
Na parte dos “subagentes”, tenho que admitir que a configuração em que o Claude Code chama o o3 via sigoden/aichat me salvou inúmeras vezes
Há problemas em que o o3 é especialmente bom: condições de corrida, caça a bugs, coisas que exigem muito contexto e capacidade de raciocínio muito alta
Dito isso, depois que o Opus 4 saiu, tenho usado menos; e, claro, isso não é, de forma alguma, algo como subagentes
Uso este prompt com @include no CLAUDE.md principal: https://github.com/pgflow-dev/pgflow/blob/main/.claude/advan...

sigoden/aichat: https://github.com/sigoden/aichat
- Espera, como assim? Como você faz várias coisas ao mesmo tempo com git worktree?
O terminal parece ser uma interface quase perfeita para LLMs. Fico curioso se essa abordagem vai ser preferida a uma integração personalizada com IDE
- Sim. Ele consegue acessar literalmente tudo, incluindo servidores MCP. É muito bom ver o Claude Code consultar o banco de dados com um usuário somente leitura ou abrir um navegador Puppeteer para verificar se uma mudança de CSS parece estranha
  É uma interface perfeita, e a Anthropic fez direito
  Também dá para depurar meu cluster k8s com comandos kubectl e consultar o Prometheus pela API; olha só que incrível
- Até certo ponto sim, mas acho que o futuro dos LLMs será rodar 5 tentativas separadas em paralelo para criar uma correção, já que o tempo de LLM é mais barato que o tempo humano
  Quando esse elemento entrar no workflow, você vai querer subir vários contêineres, e aí as vantagens do terminal ficam mais fracas
- À medida que os modelos melhorarem, a IDE vai parecer uma ferramenta de baixo nível
- Como assim? O terminal é literalmente a pior interface
  Você está dizendo que não quer editar o código manualmente depois que ele for gerado?
Pedir para explicar o borrow checker do Rust é um dos piores exemplos para demonstrar capacidade de leitura de código. Há montanhas desse conteúdo nos dados de treinamento
- Concordo. Se você pedir para explicar como exceções são tratadas em tasks do Python asyncio, mesmo dando todo o código, ele fica oscilando como o pior estagiário do mundo
  Além disso, não há como “ensinar”, e mesmo que houvesse, isso não persiste além do contexto atual
  Para tarefas importantes, mas relativamente simples, é uma perda total de tempo
- A reclamação de que “há montanhas desse conteúdo nos dados de treinamento” é estranha
  Se alguém me explica o borrow checker do Rust, eu deveria rejeitar porque essa pessoa já leu explicações sobre o borrow checker e reclamar que “estava nos dados de treinamento”? Você acha que alguém entende o borrow checker sem ter aprendido de alguma forma?
  Entendo, em certa medida, o ponto que você quer defender: não há muitas evidências de que esse tipo de ferramenta consiga criar ideias novas, e a quantidade de conhecimento é tão grande que é difícil detectar esse fenômeno. Mas, na prática, mesmo dentro do quadro das alucinações, é útil e ajuda, então não me preocupo muito
Se a atenção aos detalhes é um dos melhores sinais de que alguém se importa com artesanato, o fato de os termos legais da Anthropic serem logicamente impossíveis de cumprir não é um mau sinal para confiar nela como uma guardiã cuidadosa da ASI?
Se não dá para usar no trabalho sem violar a proibição de uso competitivo, não parece exatamente “seguro no nível das Três Leis da Robótica”
- Não sei quanto ao departamento jurídico, mas o produto Claude Code mostra sinais de uma atenção generosa aos detalhes
  Eles chegam ao ponto de rodar Haiku no contexto para criar verbos fofos e adequados para o indicador “working…”
claude --dangerously-skip-permissions # science mode

Ri disso quando vi
Concordo. O Claude Code parece mais poderoso que o Cursor, e acho que um dos motivos é a possibilidade de scripting
No fim, o Cursor é um editor, e o Claude Code é um canivete suíço turbinado com esteroides
Uso bastante o Claude Code além de bases de código tradicionais. Rodo para todo tipo de coisa no meu cofre do Obsidian, peço para ele criar scripts para atalhos locais personalizados que enviam screenshots para o meu CDN e geram links em Markdown, ou para criar programas que conversam com o Ollama para resumir os comandos de terminal do último dia
Antes eu precisava pensar se valia a pena criar um script para alterar formatos de arquivo ou se faria manualmente; agora simplesmente rodo o Claude naquele diretório e deixo ele resolver. É realmente útil para várias coisas
- O problema é que o Claude Code só funciona se você tiver um plano
  Não dá para usar via API, então fico me perguntando se US$ 100 por mês é mesmo suficiente. Agora uso o dia inteiro, todos os dias, e acho que devo estar consumindo muito mais do que os US$ 100 que pago
- Fiquei bem curioso para saber para que você usa no cofre do Obsidian
- Como você faz scripting com o Claude Code? Tenho usado pela CLI, mas nunca tinha pensado em chamar o Claude Code a partir de scripts; parece bem interessante
- Alguns dias atrás pedi a um LLM para organizar um monte enorme das minhas anotações em pastas por categoria. Nossa, ajudou muito
À parte, é realmente difícil ler aqui por causa do contraste entre fundo e texto
- No meu caso, é por causa do cursor piscando lá no topo. Fica difícil me concentrar no texto
- Dá para simplesmente pular, você não perde muita coisa
Nem aqui nem ali ainda há menção ao Opus
Depois de experimentar de tudo, acabei ficando no plano “Max” de US$ 100 por mês da Anthropic para usar o Claude Code. Aí descobri que o Claude Opus 4 é o melhor modelo para a minha situação atual, isto é, código matemático e pesquisa, mas também o mais caro
Bati no limite de sessão de 5 horas e mudei para a API, queimando US$ 20 em uma hora. Então subi para o “Max” de US$ 200 por mês e ainda não bati no limite
O modelo importa. Essas histórias são todas meio no estilo “encontrei alguém que não era muito inteligente”. Claro
- Tudo isso foi feito com Opus

Inalando a AGI com o Claude Code

Introdução

Experiência de sessão de programação com o Claude

O diferencial do Claude Code

Percepção sobre o limiar da AGI

Conclusão e perspectivas

Leituras relacionadas

1 comentários

Opiniões no Hacker News