15 pontos por GN⁺ 20 일 전 | 2 comentários | Compartilhar no WhatsApp
  • Em vez da assinatura fixa do Claude Code (US$ 100/mês), a proposta é migrar para um uso dividido entre Zed (US$ 10/mês) e créditos do OpenRouter (US$ 90/mês)
  • O Zed é um editor com respostas rápidas e rastreamento visual de arquivos, com integração direta a vários modelos via Agent Client Protocol
  • O OpenRouter permite escolher entre vários provedores de modelo, acúmulo de créditos e configuração de Zero Data Retention, garantindo ao mesmo tempo eficiência de custo e proteção de dados
  • O Cursor é uma alternativa com compatibilidade com extensões baseadas em VSCode e arquitetura centrada em orquestração de agentes, com suporte a controle refinado baseado em regras
  • Para quem frequentemente esbarra nos limites do Claude Code, a combinação Zed + OpenRouter é uma escolha mais flexível e sustentável

Redistribuindo um orçamento mensal de US$ 100 do Claude Code entre Zed e OpenRouter

  • Mudança da assinatura mensal de US$ 100 do Claude Code para um uso dividido entre o editor Zed (US$ 10/mês) e créditos do OpenRouter (US$ 90/mês)
    • Mesmo nos períodos sem uso, os créditos ficam acumulados e podem ser aproveitados com flexibilidade, sem prazo curto para expiração
    • A ideia surgiu da insatisfação com os limites de uso do Claude Code e sua estrutura de cobrança considerada ineficiente

Escolha do Agent Harness e exploração de vários modelos

  • Agent Harness é o sistema responsável por troca de mensagens com LLMs, chamadas de ferramentas e coordenação de workflows
    • O Claude Code é um exemplo representativo, coordenando leitura e escrita de arquivos e chamadas ao modelo
  • Embora o Opus seja um modelo líder de mercado, também é possível usar vários modelos com custo e velocidade ajustáveis conforme a complexidade da tarefa
  • É possível conectar vários modelos ao Agent Harness para montar um workflow mais eficiente

Zed e OpenRouter

  • Plano do Zed: US$ 10/mês
    • É avaliado como um editor mais rápido e responsivo que o VSCode
    • O Agent Harness embutido é simples, mas permite rastrear visualmente o processo de edição de arquivos e adicionar perfis personalizados
    • Suporta integração direta com modelos externos, como Claude Code e Mistral Vibe, via Agent Client Protocol (ACP)
  • O ponto fraco é a falta de extensões em comparação com o VSCode, embora ainda seja suficiente para as principais linguagens e tarefas
  • O preço de tokens do próprio Zed é mais alto do que usar API diretamente, então integrá-lo ao OpenRouter é mais econômico
    • Pelo OpenRouter, é possível usar janelas de contexto de até 1M tokens
    • Na integração padrão do Zed com Gemini 3.1, o limite é de 200k tokens
  • OpenRouter

    • O OpenRouter é uma plataforma que permite escolher entre vários modelos e provedores, funcionando com recarga antecipada e uso por API key
    • Créditos não utilizados expiram após 365 dias, permitindo acumular saldo sem perda durante períodos sem uso
    • Há uma taxa de 5,5%
    • Para proteger a privacidade, desativa-se a opção que usa entradas e saídas para melhoria do produto e mantém-se ativo apenas o endpoint de Zero Data Retention (ZDR)
      • Alguns modelos (qwen/qwen3.6-plus, entre outros) não podem ser usados por serem exclusivos da Alibaba Cloud
    • Essas configurações servem para minimizar o risco de exposição de dados

Cursor

  • Planos do Cursor: US$ 20 / 60 / 200 por mês
    • Em 2025, houve migração de VSCode & Copilot para Cursor, que oferece uma experiência de programação com agentes além do autocompletar
    • O Cursor 3.0 foi totalmente reescrito em Rust e evoluiu para uma arquitetura centrada em orquestração de agentes
    • Por ser baseado em um fork do VSCode, há compatibilidade com todas as extensões, além de recursos avançados de depuração como o modo debug
    • É possível controlar com precisão a aplicação baseada em regras
      • Regras podem ser aplicadas apenas a arquivos específicos (*.py, **/models.py etc.)
      • Maximiza a eficiência da janela de contexto
    • Ao exceder o uso incluído no plano, a cobrança passa a ser por preço de API, e o valor mínimo mensal de US$ 20 não é acumulado

Integração entre Claude Code e OpenRouter

  • O Claude Code é otimizado para modelos da Anthropic, mas também pode ser integrado a outros modelos via OpenRouter
  • Para conectar o OpenRouter ao Claude Code, é necessário configurar as seguintes variáveis de ambiente
    • OPENROUTER_API_KEY, ANTHROPIC_BASE_URL=https://openrouter.ai/api, ANTHROPIC_AUTH_TOKEN etc.
    • Exemplo de mapeamento de modelos:
      • anthropic/claude-opus-4.6, anthropic/claude-sonnet-4.6, anthropic/claude-haiku-4.5
    • Após a configuração, é possível verificar o uso da API do OpenRouter com o comando /status

Alternativas em CLI, como OpenCode

  • Há vários Agent Harness em CLI que podem ser usados com o OpenRouter
    • OpenCode

      • Baseado em TypeScript, tem ampla cobertura de recursos e é a ferramenta usada com mais frequência
    • Crush

      • Baseado em Go, tem ótimo desempenho, mas a customização de modelos é manual e pouco prática
      • Ferramentas dedicadas a modelos específicos, como Gemini CLI, também têm forks compatíveis com OpenRouter, permitindo experimentar vários modelos

Conclusão

  • Atualmente, o uso combinado é de Zed (US$ 10/mês) e Cursor (US$ 20/mês), enquanto os US$ 70 restantes são recarregados automaticamente como créditos no OpenRouter
    • Os créditos não expiram rapidamente e ficam acumulados para uso quando necessário
  • Para quem atinge com frequência os limites do Claude Code, a combinação Zed + OpenRouter é uma alternativa mais flexível e eficiente
  • É possível começar com o Zed gratuitamente, e o OpenRouter pode ser usado imediatamente com uma recarga de apenas US$ 20

2 comentários

 
shakespeares 16 일 전

Será que não vai travar de novo?

 
GN⁺ 20 일 전
Comentários do Hacker News
  • O OpenRouter cobra uma taxa, mas acho que isso vale a pena pelo fato de gerenciar dezenas de modelos com uma única chave de API, além de permitir rastrear custos por solicitação, comparar resultados entre modelos e configurar presets e regras de roteamento
    Em contas com vários usuários, esses recursos são especialmente úteis, e a possibilidade de usar livremente chaves de API sem ficar preso a uma assinatura também é uma grande vantagem

    • Para inferência de usuários internos, acho que uma instância do LiteLLM é mais eficiente que o OpenRouter
      Dá para gerenciar vários modelos de forma transparente com uma única chave de API interna, e até trocar de provedor sem que os usuários percebam
      Ainda assim, para equipes pequenas ou usuários não técnicos, a cobrança por token do OpenRouter pode ser mais prática
    • Gosto muito das configurações de preset e da acessibilidade do OpenRouter
      Eu mantenho várias assinaturas, mas no resto o OpenRouter resolve bem
    • Como dá para misturar modelos baratos e modelos avançados conforme a situação sem precisar gerenciar APIs de vários provedores separadamente, sinto que a taxa de 5% vale totalmente a pena
    • Também dá para implementar a mesma coisa com o Kilo Gateway sem taxa
    • Se alguém já usou o Kilo, queria ouvir uma comparação com o OpenRouter
  • Testei o Zed como substituto do VSCode; no começo pareceu bom, mas com o tempo foram se acumulando pequenos incômodos (papercuts)
    Ao usar o servidor de linguagem de TS, o consumo de memória é excessivo, e a DX parece ficar em uns 85% do VSCode
    Especialmente no Linux, é uma pena que os emojis não sejam renderizados

    • O uso de memória me pareceu aceitável, mas há muitas diferenças de UX e foi difícil me adaptar
      Por exemplo, com Ctrl+P você não encontra “Open Folder”; é preciso digitar “Workspace”
    • A falta de suporte a fontes bitmap e algumas escolhas estranhas de UI prejudicam a produtividade
      Também há um bug no Wayland em que as cores ficam erradas
      Ainda assim, a transparência do fundo parece mais natural que no VSCode
    • O suporte a TailwindCSS vir habilitado por padrão foi confuso
      Mesmo assim, ele continua mais rápido que o PyCharm, mas esses probleminhas vão se acumulando
    • Por causa desse bug, não consegui entrar em bibliotecas empacotadas durante o debugging e no fim voltei para o VSCode
    • O recurso de multibuffer foi útil, mas o sistema de extensões parecia imaturo em comparação com o VSCode
      Não consegui resolver um erro da extensão de Svelte e acabei voltando para o VSCode
  • Com a combinação Zed/OpenRouter, estou conseguindo mais de US$ 1.000 em uso com bom retorno pagando só uma assinatura de US$ 100
    Mesmo no modo de raciocínio profundo (thinking) do Opus 4.6, continua sendo eficiente o bastante

    • Ultimamente o Claude tem mostrado erros estranhos e raciocínios ilógicos com frequência, e sinto que a qualidade caiu
      Por isso migrei para o Codex e recuperei um nível de qualidade parecido com o antigo Claude Code
      Pessoalmente, também pretendo testar os modelos GLM
    • Os modelos baratos do OpenRouter são bons, mas acho que o Opus 4.6 é insubstituível
      Fazer exploração com modelos baratos e deixar as revisões importantes para o Opus é uma estratégia híbrida eficiente
    • Algumas pessoas dizem que os provedores de tokens não conseguem ter lucro, mas olhando o uso real dá para entender
    • Usei cerca de 550 milhões de tokens em um mês: 320 milhões no Gemini e 240 milhões no Opus, com gasto total de US$ 600
    • Fui testar com o Sonnet e gastei US$ 1 em 30 minutos
      Na prática, a assinatura é um preço fortemente subsidiado
  • Queria saber se alguém já usou o pi.dev

    • O pi é um ótimo harness
      Tem muitos recursos de extensão e você pode até mandar o próprio LLM criar novas extensões
      É fácil de experimentar e customizar, então serve bem para trabalho criativo
    • Vale a pena ver o vídeo de apresentação do Mario e o canal do Armin Ronacher
      A comunidade no Discord continua ativa
    • Usei Claude Max/Opus junto com o pi e os resultados foram impressionantes
      Mas, por causa das mudanças de cobrança da Anthropic, não consigo usar créditos Max no pi, então devo migrar para o plano de US$ 250 do OpenAI Codex
    • A simplicidade e transparência do pi são seus pontos fortes
      Fiz um projeto de mapa de transporte público usando dados GTFS, e o modelo escreveu automaticamente 98% do código
      O recurso /tree facilita gerenciar o histórico, e também dá para adicionar extensões por conta própria
      Vale consultar o repositório pi-skills
    • Ele é muito mais simples que o Claude e tem uma estrutura de núcleo pequeno e extensível
      Você pode adicionar só as funções de que precisa ou estender tudo manualmente
  • Depois de atingir o limite do Claude, testei OpenCode + GLM 5.1 via OpenRouter, e fiquei impressionado porque o desempenho foi parecido com o do Opus 4.6

    • Queria saber quanto isso custou para usar
  • Acho que o plano de US$ 40 do GitHub tem um ótimo custo-benefício porque oferece GPT-5 e variantes do Claude ao mesmo tempo
    Combinado com o plano de US$ 20 do ChatGPT, fica eficiente

    • O plano de US$ 10 do GH Copilot tem corte excessivo de contexto, então o desempenho cai
      Mesmo assim, a integração com VSCode e os recursos de MCP/LSP são impressionantes
      O Copilot parece mais uma ferramenta genérica e barata do que algo voltado para especialistas
    • Também existe a preocupação de que isso seria “fornecer o código-fonte como dado de treinamento por US$ 40”
      Veja esta matéria relacionada
    • O plano de US$ 20/mês do Google também oferecia um uso quase ilimitado do Claude Opus
  • Queria saber se alguém usa monorepo no Zed
    Estou procurando uma forma de gerenciar configurações separadas por pasta, como no VSCode

  • O autor falou positivamente de US$ 70 em créditos do OpenRouter, mas na prática acho que isso é menos eficiente que o plano Max da Anthropic
    Sinto que a premissa do texto que recomenda a configuração com OpenRouter não está totalmente correta

    • O próprio autor explica que gosta do Opus, mas, por causa de um padrão de uso em rajadas, o OpenRouter é mais flexível
      A Anthropic não deixava o uso claramente quantificado, o que era incômodo, e depois de tentar rastrear isso com OpenTelemetry ele acabou migrando para o OpenRouter
  • Na minha opinião, o plano de US$ 20 do Ollama Cloud é o mais sensato
    Os modelos GLM5 e kimi são competitivos, e proteção de privacidade e política sem logs são vantagens importantes

    • Eu evitava o Ollama porque a explicação dos limites de uso era vaga; queria saber em que tipo de tarefa ele é usado na prática
    • Também queria saber se o Ollama é mais barato e mais rápido do que usar GLM5 em uma VPS com cobrança por token, e como é a velocidade de processamento de tokens
  • Cancelei o Claude Code Max e migrei para OpenCode Zen + GitHub Copilot
    O Claude Code consome a cota rápido demais
    Veja OpenCode Zen

    • Embora o Zen diga ser sem fins lucrativos, sinto que a estrutura de recarga automática, que empurra saldo restante para o usuário, não é transparente
      Acho que assumir isso com honestidade como estratégia de marketing transmitiria mais confiança
    • Tenho curiosidade sobre a comparação entre Claude Code e OpenCode Zen
      Ultimamente tenho usado menos por causa da política recente de cotas do Claude