Claude Code ganha versão web — agora dá para delegar tarefas de código direto no navegador

(anthropic.com)

11 pontos por GN⁺ 2025-10-21 | 2 comentários | Compartilhar no WhatsApp

A Anthropic lançou a versão web do Claude Code, permitindo que desenvolvedores deleguem tarefas de código diretamente pelo navegador
Após conectar um repositório do GitHub e descrever a tarefa, o Claude faz a implementação automaticamente em ambiente de nuvem e oferece suporte a múltiplas tarefas simultâneas (parallel tasks)
Cada sessão é executada em um ambiente sandbox isolado, mantendo a segurança, além de oferecer criação automática de PR e resumo das alterações
Esta versão beta também pode ser usada no app para iOS, permitindo corrigir e revisar código em movimento
Foi adotado um modelo de execução em nuvem com foco em segurança, reforçando ao mesmo tempo a eficiência no desenvolvimento e a segurança

Execução de código no navegador

A Anthropic lançou o recurso Claude Code on the web
É uma funcionalidade que permite delegar tarefas de programação diretamente ao Claude usando apenas o navegador, sem terminal
- Ao conectar um repositório do GitHub e descrever a tarefa, o Claude escreve e modifica o código automaticamente
- Cada tarefa é executada individualmente em um ambiente isolado na nuvem, com acompanhamento do progresso em tempo real
- O usuário também pode ajustar manualmente (steer) a direção do trabalho do Claude durante a execução

Suporte a execução paralela

O Claude Code pode executar tarefas em vários repositórios ao mesmo tempo (parallel execution)
- Isso permite tocar em paralelo correções de bugs, melhorias de rotina e desenvolvimento simultâneo
- Após a conclusão, há criação automática de Pull Request (PR) e resumo das mudanças, acelerando o desenvolvimento
Com o processamento paralelo baseado em nuvem, é possível avançar em vários projetos ao mesmo tempo sem as limitações de recursos do ambiente local

Adequado para vários fluxos de trabalho

A versão web complementa o fluxo de trabalho existente do Claude Code e é especialmente adequada para tarefas como
- Perguntas e respostas sobre a estrutura do projeto e mapeamento de código, além de exploração do código
- Correção de bugs e execução de tarefas repetitivas e bem definidas
- Mudanças no backend e aplicação de desenvolvimento orientado a testes (TDD)
Também está disponível na beta do app para iOS, permitindo fazer experimentos de programação em nuvem com o Claude mesmo em deslocamento

Execução em sandbox com foco em segurança

Todas as tarefas são executadas em um ambiente sandbox com restrições de rede e sistema de arquivos
- O controle de acesso ao Git por meio de um proxy de segurança garante que apenas repositórios autorizados possam ser acessados
- Com configurações de rede personalizadas, é possível adicionar seletivamente domínios permitidos (por exemplo, para baixar pacotes npm)
A arquitetura detalhada é apresentada no blog oficial de engenharia e na documentação

Como começar

O Claude Code on the web está disponível no momento como uma research preview para usuários Pro e Max
- Em claude.com/code, é possível conectar o primeiro repositório e começar a trabalhar
- As sessões em nuvem compartilham o mesmo limite de requisições (rate limit) do Claude Code existente
- Mais detalhes podem ser consultados na documentação oficial

Implicações

A versão web do Claude Code acelera a migração para a nuvem da “programação no estilo agente de IA” e apresenta um novo paradigma de ambiente de desenvolvimento que fortalece velocidade de desenvolvimento, segurança e mobilidade

2 comentários

laeyoung 2025-10-21

Usei e, como esperado, é melhor do que eu imaginava.

GN⁺ 2025-10-21

Comentários no Hacker News

Gostaria de ouvir experiências sobre como Codex / Claude Code diferem de trabalhar com chat ou agents no Cursor, e qual dos dois é melhor, porque quero ser um engenheiro mais eficiente na empresa e estou perguntando por isso
Nossa equipe usou tanto o Claude Code até o ano passado que chegamos a gastar mais de $70K por ano, mas quase migramos completamente para o Codex CLI. Com o Codex CLI, conseguimos realizar trabalhos de software em grande escala que antes eram impossíveis para mim e para qualquer pessoa da minha equipe. Agora, quase só consultamos o CC uma vez a cada duas semanas para revisão de código e documentação de bugs, e a taxa de sucesso é mais ou menos. Quando o Claude Code apareceu pela primeira vez, foi realmente impressionante e valia assinar na hora. Mas o Codex alcançou o CC e ficou muito melhor em tarefas longas e problemas difíceis. O Claude Code às vezes simplesmente desistia em problemas difíceis e dizia para comprar uma solução pronta. Graças ao Codex, a capacidade da organização de software em si melhorou bastante. Isso está começando a ficar conhecido agora. Não tenho relação com nenhuma empresa de AI; pessoalmente eu torcia pela Anthropic, mas o Codex CLI é esmagadoramente melhor e também mais barato. Acho que a Anthropic vai precisar de alguma inovação se quiser alcançar a OpenAI de novo. No momento, o Codex está claramente na frente
- Também usei o Codex CLI e ele é realmente excelente, mas ainda faltam nele recursos importantes que eu uso todos os dias no Claude Code, então não consigo migrar completamente. Por exemplo: sistema de permissões para comandos Bash, rollback dentro da conversa e do código, troca fácil de modo de aprovação (keybind), envio de mensagens durante a execução do trabalho (no Codex fica em fila até o fim; no Claude entra em tempo real), o incômodo do Codex de ter que aceitar repetidamente os mesmos comandos (no Claude dá para definir aprovações por sessão), gerenciamento de contexto com Agents, um modo de planejamento de verdade, o recurso Skills com carregamento sob demanda. O sandbox do Codex é confuso de usar, e como diretórios de sistema e internet vêm bloqueados por padrão, os comandos falham com frequência. O Codex também processa comandos mais por Python do que por Bash, o que dificulta monitorar. Se o Codex alcançar esses recursos, eu pensaria seriamente em migrar; até lá, é mais um ótimo modelo com uma camada mediana por cima
- Minha opinião não é publicidade, mas como a internet hoje está cheia de propaganda, de repente fiquei curioso quanto a OpenAI pagaria para colocar esse tipo de elogio ao HN como comentário de topo
- Também concordo totalmente. Ainda lembro da mudança quase mágica por volta de junho. De repente começaram noites viradas testando coisas que eu tecnicamente não conseguia fazer, mas que valia experimentar porque eram possíveis em conceito. Eu achava que substituiria o Claude Code pelo Codex CLI (GPT-5), mas agora sinto que o GPT-5 Codex é muito melhor para o meu trabalho (embora meu setor seja nichado, então o Codex ainda seja fraco em vários conhecimentos centrais de domínio). O Claude Sonnet 4.5 ainda é melhor para trabalho de scaffold, mas na implementação real de funcionalidades o Codex produz código mais robusto e limpo. A promessa de marketing de “nível engenheiro sênior” finalmente parece verdadeira. O preço do Codex também é 40~50% mais barato. Agora, para superar o Codex, parece que vai ser necessária uma evolução realmente inovadora. Daqui para frente, o maior desafio dos agentes será velocidade. Se o CC fosse duas ou três vezes mais rápido, eu ainda usaria o CC mesmo com qualidade igual, mas se não for isso, o Codex é minha ferramenta principal
- Na prática, mandei o Codex CLI (gpt-5-codex high) e o Claude Code 4.5 sonnet (às vezes opus 4.1) fazerem o mesmo trabalho longo umas 10 vezes, e também fiz os dois modelos avaliarem o trabalho um do outro. Em 100% dos casos, os dois modelos avaliaram que o Codex era superior. O Claude deixa escapar requisitos, mostra descuido e dispersão o tempo todo, enquanto o Codex cumpre todos os requisitos. O Codex é lento, mas como entrega resultados que eu não preciso ficar retrabalhando repetidamente, fico muito mais satisfeito
- No Codex, quase não tenho nada para fazer, e o Claude Code é rápido e entende bem o “contexto”. O Claude também testa melhor o próprio código. Eu esperava que os dois modelos fossem parecidos, então o resultado me surpreendeu
No fim de semana passado, experimentei o Claude Code com antecedência e compartilhei minhas notas no blog. É um produto realmente sólido e funciona colocando uma UI web/mobile por cima do Claude Code CLI (usando claude --dangerously-skip-permissions). A Anthropic reconhece que um “Claude Code sem precisar de aprovação em cada etapa” aumenta bastante a produtividade, então está investindo em sandboxing
- O interessante é que, no meu caso, aconteceu o contrário: no CC, desativar “allow edits” me deu resultados melhores, porque consigo editar direto inline e revisar o código ao mesmo tempo. Já o Codex serve melhor para criar features rapidamente e esquecer delas como “lenha de fogueira”. Mas o Claude tem vantagem em entender a intenção do problema, e a velocidade e o loop iterativo são mais rápidos
- Fico curioso sobre qual é o nível de bagunça que isso pode causar em um ambiente de sandbox. Coisas como allowlist de arquivos/domínios parecem, por essência, vulnerabilidades que vão se repetir por décadas. Dá preocupação quando a segurança parece no nível de jogar input no shell com barra invertida
As três partes que achei mais interessantes desta vez foram: a ida do Claude Code para iOS, a transição natural da web para o CLI e a abertura em código aberto do sandbox nativo do SO para restringir fs e rede sem contêineres. Só que, embora enfatizem a restrição de rede de saída, há domínios como gist.github.com na allowlist, o que me parece um pouco frouxo por facilitar exposição externa
- O link do Github para o sandbox nativo é este aqui
- Fiquei feliz de ver que já foi adicionado ao app, mas usando agora parece que ainda tem vários bugs
- Vazamento de informação sempre pode acontecer; a questão é se é difícil o bastante para um atacante romper minha defesa. Mas, ao mesmo tempo, dá até receio de organizar e publicar esse tipo de coisa porque depois isso pode voltar como dado de treino
Acho que esses agentes em background ainda não entregam a experiência de desenvolvimento que eu espero. Esse modelo de fazer push para branch só por PR em um ambiente ao qual não tenho acesso, e depois ter que dar checkout localmente, é desconfortável. AI coding precisa estar colado ao loop de desenvolvimento; PR é etapa de revisão final, não combina com o fluxo principal de desenvolvimento de código. O padrão deveria ser um ambiente isolado com conexão por um clique via Cursor/VSCode Remote SSH. Na prática, nenhuma ferramenta de AI como Claude acertou de primeira para mim; sempre foi necessário algum retoque manual. Verificar e refinar direto no IDE faz parte do cotidiano
- Para mim, é muito mais simples rodar o agent direto em um servidor remoto de teste/desenvolvimento via SSH e fazer uma sanity check com o VS Code. Isso é muito mais prático do que desenvolvimento local ou configurações complexas
- Fiquei um pouco decepcionado com esse anúncio, porque o que eu realmente quero é um app companheiro (mobile/web) integrado ao ambiente CLI. Ele deveria funcionar com meu ambiente VM de servidor de desenvolvimento já existente, com suporte a SSH, VSCode Remote e Web (tty no navegador ou tunnel do vscode.dev). Seria ótimo poder, durante uma caminhada, conferir se o Claude está trabalhando bem e deixar comentários como “LGTM” para ele seguir o PLAN.md. Como usar SSH na tela touch do celular é desconfortável, bastaria uma UI de chat. Já vi coisas parecidas em projetos do Github ou em Show HN como “Happy Coder”, mas nunca usei de verdade, então uma integração first-party seria o ideal
- Acho que esse fenômeno aponta para um problema mais fundamental: na maioria dos casos, teste e depuração de código são quase impossíveis remotamente. O ambiente de trabalho é um container efêmero, então não há nenhum dos meus dados, só o repositório. Por exemplo, o modelo não consegue fazer npm run dev, abrir a página web, clicar, validar comportamento, lidar com builds pesados, manter sessões ou preservar dados do dia para a noite. O conceito de agent rodando na nuvem é bom, mas precisaria ser um ambiente bem mais persistente, e a própria UI teria que permitir desenvolvimento de webapps, programas com GUI, execução real e interação para que isso fosse realmente usar um computador. Com os modelos atuais, isso provavelmente ainda é caro demais para oferecer ao público em massa
- Concordo que revisar e iterar código por PR não encaixa bem. Desenvolvedores humanos até trabalham assim há muito tempo, mas isso não combina com código gerado por AI ou coding agents. Em vez de forçar isso à estrutura antiga, acho que precisamos de algo como um git AI-native
- Mas os gerentes respondem muito melhor a argumentos de venda do tipo “coloque a story e receba um PR pronto”
O vídeo de demonstração no YouTube é bem engraçado, o demo está aqui. O desenvolvedor coloca o prompt e simplesmente recebe um PR com comentários; ele nem olha diretamente para o resultado que foi gerado. O mercado-alvo fica claro demais
Isso seria como Jules / Codex / Copilot agent? Ou seja, você envia a solicitação para a nuvem e depois de um tempo recebe o resultado em PR? O curioso é que todos parecem convergir para um conjunto de recursos parecido, e a escolha final parece ser mais questão de preferência. Hoje, com Copilot + Codex, consigo usar 4 engenheiros autônomos e distribuir tarefas conforme dificuldade e velocidade, o que aumenta muito a produtividade. E acho que as startups que gritavam “Claude in the cloud” vão sofrer daqui para frente
Tenho visto bastante por aí esse relato de “migramos de mais de $70K em uso do Claude Code para codex CLI”. Eu também mudei do Cursor para o CC em junho/julho e, uns 8 meses antes, fiz o mesmo com VSCode + Copilot pelo mesmo motivo. No começo achei que essas avaliações fossem tudo guerrilla marketing, mas o CC realmente é claramente melhor que o Cursor. Agora quero testar o Codex também, e acho positivo que tanta concorrência esteja permitindo evolução rápida. É até difícil acreditar que em poucos meses troquei de IDE e workflow três vezes, e isso também cansa bastante
- A OpenAI parece limitar o quanto o gpt-5-codex pode “pensar profundamente” dependendo do plano de assinatura, enquanto Anthropic/Claude parece limitar apenas o uso. Eu também testo o Codex todo mês, mas em muitos casos os resultados feitos por Charlie ($500/mês) ou Claude acabam sendo mais fáceis de fazer merge. Dependendo da tarefa, a variação pode ser grande
- Hoje em dia a parte de IDE está bem mais desacoplada, então isso cansa menos. Parece difícil para o Cursor competir se for só vender tokens enquanto consome contexto. Eu alterno entre CC e Codex, mas no geral o Codex está em uma categoria própria. No momento, parece não ter substituto
Tenho um desejo em relação às interfaces web de AI: seria bom se claude.ai e chatgpt.com, como outros SaaS, suportassem login padrão com usuário/senha sem 2FA, para que usuários de navegadores focados em privacidade pudessem entrar de forma simples e rápida. Tenho receio de usar autenticação externa pouco confiável como SSO, e o login por e-mail da Anthropic ou o MFA da OpenAI quebram o fluxo e são incômodos. Também é chato ter que combinar cliente desktop separado e não confiável com sandbox em máquina virtual. Poder usar direto no navegador já seria suficiente
- Ultimamente, por causa de credential stuffing com reutilização de senhas, MFA é uma das medidas de segurança mais eficazes. Se as empresas não adotarem isso, podem acabar levando uma avalanche de chargebacks de cartão de crédito. Espero que virar padrão conferir novas senhas contra bases vazadas, como haveibeenpwned. Eu uso um workflow parecido, e recomendo sites com login por passkey porque entram sem tempo de espera
- Que tal suportar algo como WebAuthn? O método atual de login do claud.ai é bem desconfortável
Recentemente fiz algo semelhante para o OpenCode e deixo aqui o link open source caso seja útil para alguém. Também pode rodar em modo frontend (em breve haverá versão hospedada) e você pode apontar para seu próprio servidor de API do OpenCode para conectar. Ou então subir também o servidor de API e expô-lo por proxy para acessar com segurança pela web. A UI é responsiva, e o ponto principal é permitir que, mesmo fora de casa, você envie pedidos para a AI pelo celular (“faça X”) e ela processe isso na hora. Não há criação de ambiente sandbox, mas o usuário pode combinar livremente qualquer sandbox que quiser. Diferente do Claude Code, os modelos também são livres para escolha

Claude Code ganha versão web — agora dá para delegar tarefas de código direto no navegador

Execução de código no navegador

Suporte a execução paralela

Adequado para vários fluxos de trabalho

Execução em sandbox com foco em segurança

Como começar

Implicações

Leituras relacionadas

2 comentários

Comentários no Hacker News