4 pontos por sugeuljin 2026-02-23 | 8 comentários | Compartilhar no WhatsApp

Estou em uma situação em que posso usar tokens do Gemini por um custo muito baixo, então, como no título, estou usando o Claude Code conectado a um backend proxy ligado ao Gemini. O Gemini CLI é agressivo demais (mesmo quando peço para ele só ler o código, ele insiste em tentar modificar alguma coisa), então não combinou muito comigo. A arquitetura de agente do Claude Code parece funcionar melhor, então estou usando com satisfação mesmo após trocar o backend.

Essa camada de proxy basicamente adiciona mais uma camada de abstração, então OpenAI, XAI, Claude e Gemini podem todos ser conectados ao Claude Code e usados da mesma forma.

Tive que resolver alguns problemas chatos, como streaming + parsing de JSON e também a limpeza de esquemas para tool use, mas, se houver alguém querendo tentar algo parecido, avise nos comentários e posso publicar isso como open source.

Se alguém já fez um trabalho parecido, compartilhe a experiência~

8 comentários

 
srebaragi 2026-03-02

Minha abordagem é um pouco diferente: em vez de ferramentas de agente como Claude Code ou Cowork, estou desenvolvendo por meio de conversas em linguagem natural em chats web de LLM puros. Subi um proxy no meu próprio servidor para conectar as APIs do Claude ↔ Gemini, e a estrutura é a seguinte: o Gemini toca os serviços em produção real (chatbot no KakaoTalk, agente de linguagem natural para ERP), eu conduzo revisão de código e projeto de arquitetura conversando com o Claude, e a pessoa humana faz só a aprovação final e o deploy.
Gemini para aprendizado de programação, Claude para revisão de código, humano para aprovação final — essa divisão de papéis funciona muito bem.
Comparado com agentes baseados em editor de código (Claude Code etc.), outra vantagem é que o consumo de tokens é muito menor. Como trocamos código por conversa, sem file I/O, e a pessoa aplica as mudanças manualmente. Concordo especialmente com a parte de que "o design de agente do Claude é o que funciona melhor". O Gemini CLI claramente tem opiniões muito fortes (kkk), então para o papel de revisor o Claude acaba sendo melhor.

 
sugeuljin 2026-03-02

Obrigado por compartilhar sua experiência. 👍 Também concordo com a parte sobre a diferença de perfil entre o Gemini e o Claude.
Então você usa vários provedores ao mesmo tempo em uma única interface web; ao fazer programação autônoma baseada em agentes, há uma tendência de escrever de forma superficial, meio no estilo de “desenvolvimento guiado por currículo”, em vez de pensar bem em uma boa arquitetura, então eu também acho melhor fazer o design em formato de conversa. ☺️

 
winterjung 2026-02-23

Eu cheguei a rodar algo como anthropic-proxy localmente e usar outros modelos Gemini ou GPT via proxy com um comando como ANTHROPIC_BASE_URL=http://0.0.0.0:3000 claude, mas como você disse que implementou isso de forma serverless, fiquei curioso.

 
sugeuljin 2026-02-23

Nossa, então também existe open source feito em JS. Obrigado 👍👍
A estrutura interna é parecida, mas eu uso com um nível de abstração um pouco maior. (questão de preferência)

Mesmo se for feito em serverless, como o tempo de resposta do LLM é muito mais lento, é difícil perceber cold start e fica bem tranquilo de usar. Além disso, usando o recurso Function URL do Lambda, também dá para fazer streaming, então cobre tudo completamente. Principalmente, o melhor de tudo é que mesmo após reiniciar não é preciso ligar o servidor.
Se você pegar este código e alterar só a parte do FastAPI para o formato de handler do Lambda e subir na Lambda, depois de um pouco de troubleshooting, parece que dá para usar bem.

 
superwoou 2026-02-23

https://github.com/1rgs/claude-code-proxy
Existe alguma diferença em relação a esse tipo de proxy?

 
sugeuljin 2026-02-23

Obrigado por indicar uma biblioteca tão boa. Se eu soubesse disso antes, acho que teria conseguido fazer de um jeito mais confortável 👍👍
Internamente, o processamento em si de conversão do formato de entrada/saída não parece ser tão diferente assim,
mas, se eu fosse apontar a diferença, a biblioteca que você apresentou é baseada em self-service / Docker / Python / LiteLLM, enquanto eu implementei com serverless / AWS Lambda / TS / sem dependências.

 
bsh998 2026-02-23

Conectar o Gemini ao Claude Code até pode acabar causando suspensão.
Acho que é bom tomar cuidado com a onda de suspensões em massa no opencode.

 
sugeuljin 2026-02-23

Obrigado pelo comentário rápido. 🙌
A suspensão do Open Code (assinatura do Claude => integração com o Open Code) aconteceu porque uma chave de plano com valor fixo autenticada via OAuth foi usada em software de terceiros, e isso acabou gerando problema. Para usar da forma mencionada acima, é preciso emitir uma chave de API e utilizar no modelo de cobrança por uso, o que não viola os termos de uso.