1 pontos por GN⁺ 2025-06-26 | 1 comentários | Compartilhar no WhatsApp
  • O Google acaba de lançar o Gemini CLI, um agente de IA de código aberto
  • A ferramenta permite usar diretamente os recursos de inteligência artificial dos modelos Gemini no ambiente de linha de comando
  • Desenvolvedores podem realizar várias tarefas diretamente no CLI, como geração de código, resumo de documentos e tradução
  • O Gemini CLI se destaca por extensibilidade, personalização e acessibilidade de código aberto
  • Em comparação com agentes de IA existentes, oferece vantagens em conveniência e ganho de produtividade

Introdução ao Gemini CLI

  • O Google apresentou o Gemini CLI para ajudar desenvolvedores a usar facilmente recursos de inteligência artificial em ambientes de linha de comando
  • O Gemini CLI é baseado nos modelos Gemini do Google e oferece de forma integrada diversos recursos de IA, como automação de tarefas diárias de desenvolvimento, processamento de linguagem natural, tradução, geração de código e resumo de documentos
  • Por ser oferecido como código aberto, pode ser livremente customizado e expandido, além de proporcionar um ambiente no qual é possível desenvolver vários plugins e extensões de acordo com as necessidades da comunidade de desenvolvedores
  • Em comparação com ferramentas de linha de comando baseadas em LLM já existentes, oferece integração mais simples e alta praticidade; entre os exemplos de uso citados estão correção de erros de código, automação de documentação de desenvolvimento e análise de dados
  • O Gemini CLI contribui para aumentar a produtividade com acesso rápido à IA, uso em tempo real e uma estrutura que pode se integrar naturalmente ao ambiente de desenvolvimento

1 comentários

 
GN⁺ 2025-06-26
Opiniões do Hacker News
  • É confuso ver como os produtos Gemini do Google estão tão fragmentados. Mesmo sendo assinante Pro, só agora descobri que usar o "Gemini Code Assist Standard" ou "Enterprise" dá direito a mais uso. Como um usuário comum do Google que nem sabia dessas diferenças de plano ou funcionalidade, passei pela situação absurda de pagar uma assinatura Gemini ao Google e ainda assim não receber praticamente nenhum benefício no "Gemini CLI"

    • O Google, assim como a Microsoft, tem produtos em quase todas as áreas, mas a mensagem confusa faz com que as vantagens de cada um fiquem diluídas. Eu também gosto do Gemini 2.5 Pro, mas passei um bom tempo testando vários produtos de IA em busca de um assistente de chat para o dia a dia. A assinatura Gemini Pro vem incluída no Google One e é boa para usar com o Google Drive, mas eu já assino iCloud e tenho integração de dados ajustada ao ecossistema iOS, então não tenho motivo para migrar. A interface de chat do Gemini fica bem atrás do cliente macOS do ChatGPT da OpenAI. O NotebookLM é forte em resumir documentos, mas não é integrado ao chat do Gemini, então continua existindo a inconveniência de ficar pulando entre produtos do Google. No fim, estou pagando assinatura do Raycast AI porque ele se integra bem ao meu fluxo de trabalho e permite testar vários modelos. Os modelos mais novos não chegam imediatamente, mas a consistência da experiência compensa. Com o Google espalhado em tantos produtos, ele acaba ficando atrás da OpenAI (trabalho geral) e da Anthropic (programação) em usabilidade. Nos últimos meses tentaram correr atrás com Google Stitch, plugin do VSCode para GH Copilot/Cursor, Claude Code etc., mas tudo passa uma vibe de projeto paralelo que pode desaparecer logo

    • A qualidade é muito alta, mas o Google Cloud Dashboard é tão complexo que a maioria das startups e desenvolvedores individuais escolhe outra solução que não o Google. Eu hospedo modelos no Vertex, mas não está claro qual é a diferença para o Google Cloud. Existem até duas APIs por nível de projeto. Um provedor de IA deveria permitir uso sem barreiras de entrada, independentemente do porte, mas no Google você começa na API do AI Studio e, quando o projeto cresce, é forçado a migrar para a API do Vertex, o que mostra um desenho de API pouco escalável. A API compatível com OpenAI também frequentemente não funciona, então várias ferramentas que dependem disso acabam quebrando. Há barreiras de entrada causadas pela complexidade da linha de produtos de IA do Google, como a distinção entre Jules e Gemini CLI, a diferença entre Vertex API e AI Studio API, e o fato de o Vertex ser acoplado ao Google Cloud, exigindo coisas como configuração de variáveis de ambiente no desenvolvimento de apps documentação oficial das variáveis de ambiente do Vertex

    • A política de preços do Google é difícil de entender. O Gemini 2.5 Pro é, na minha opinião, o melhor modelo que já usei, mas não existe uma assinatura simples como Claude ou Cursor, em que você libera tudo de uma vez. No lado corporativo, a OpenAI já dominou completamente

    • Também existe a assinatura AI ULTRA de 300 dólares por mês. Até a assinatura Google One parece mudar o tempo todo em relação a quais "extras" oferece, então é difícil receber uma explicação clara

    • A Anthropic é a mesma coisa. Você assina e pode usar o Claude, mas o Claude Code é cobrado separadamente como "uso de API", com uma estrutura de preços separada da assinatura. Parece que alguém percebeu que nós, que preferimos CLI, aceitamos ser cobrados à parte. Dá para contornar usando a GUI, mas a navegação não é tão intuitiva quanto no terminal, então é incômodo

  • Sou uma das pessoas envolvidas neste projeto. A curva de adoção está bem íngreme no momento, então hoje, com os TPUs trabalhando pesado, estou lendo com atenção todo o feedback de vocês. Relatos de bugs e pedidos de funcionalidades são sempre bem-vindos

    • Ontem à tarde, tentei converter um algoritmo escrito em Ruby, uma linguagem que não conheço, para JavaScript puro. Tentei com GPT-4.1, mas só perdi tempo e fracassei. Por curiosidade, instalei o Gemini CLI, apontei para o projeto em Ruby e ele fez a conversão com sucesso em uma única solicitação. Fiquei surpreso porque todo o processo terminou em 5 minutos

    • Tenho uma conta organizacional paga do Google Workspace with Gemini, mas apareceu a mensagem GOOGLE_CLOUD_PROJECT environment variable not set. Como eu não uso GCP, sem orientação adicional não é nada intuitivo descobrir que valor colocar nessa variável de ambiente. O fato de um usuário pago ter menos acessibilidade do que um usuário comum do Google mostra que a documentação precisa melhorar

    • Consegui integrar com sucesso o código gerado pelo Gemini CLI ao Apple Container no M1. Explicação de como aplicar as opções do Gemini CLI no CodeRunner

    • Espero que lancem um plano de assinatura mais amigável ao consumidor, por exemplo algo como o Claude Max, combinando Gemini CLI e app Gemini, com conformidade de IP e acesso à API incluídos

    • Há produtos demais com funções parecidas, como Google Gemini, Gemini Ultra, AI Studio, Vertex AI, Notebook LLM, Jules etc., e isso gera confusão tanto na orientação ao usuário quanto no licenciamento

  • Tive resultados razoáveis com Claude Code (4 Opus) em uma grande base de código Rust, mas ainda senti limitações em tarefas complexas. Também testei o Gemini CLI hoje; a instalação foi fácil, mas o resultado foi desastroso. Na taxa de sucesso para modificar código Rust e ainda compilar, ele foi claramente pior que o Claude. Ainda assim, o Gemini rendeu a melhor piada do dia ao dizer algo como "eu baguncei o código, então vou reverter todas as alterações e recomeçar"

    • O jeito como o Gemini falha é até engraçado. Quando a correção de código não funciona, ele solta falas bem humanas tipo "isso é inesperado" e logo em seguida declara com autoconfiança "acho que os testes vão passar!". Chamam atenção essa personalidade excessivamente confiante por padrão e o uso exagerado de exclamações. Talvez durante o treinamento ele tenha aprendido que afirmar resultados com convicção gera respostas melhores

    • Há a hipótese de que o Gemini se beneficie de ter sido treinado em grandes bases de código internas do Google, mas como o uso de Rust lá dentro é pequeno, por causa do bom tooling de C++, ele seria relativamente mais fraco em Rust

    • Tive experiência parecida. Eu estava testando um recurso novo do app e tudo se embolou completamente. Ele usou funções não definidas, repetiu alguns erros e depois desistiu. O Claude completou a tarefa sem grandes problemas, mas com qualidade de código fraca; já o Gemini teve ideias individuais interessantes, porém faltou consistência e no final não concluiu

    • Também tentei e, em 15 minutos, recebi exatamente a mesma reação de "restaurar tudo ao estado original"

    • O Claude também tenta voltar ao estado inicial quando a situação degringola demais. Já vi isso acontecer quando, internamente, as edições ficam todas embaralhadas

  • Ao usar o Gemini Code Assist, todos os dados do meu código são enviados ao Google (aviso link): prompt, código relacionado, resultados, feedback de uso, informações sobre uso das funções e todos os demais dados são coletados e usados para melhorar os serviços do Google e o machine learning. Para melhorar a qualidade, pessoas podem revisar, anotar e processar esses dados diretamente. Eles ficam separados das informações da conta para proteção de privacidade e são armazenados por até 18 meses. Recomenda-se não inserir informações sensíveis nem dados que você não gostaria de expor externamente

    • Essa parte é um pouco mais complexa. A versão gratuita do Code Assist usa os dados coletados por padrão, mas é possível fazer opt-out por meio do procedimento descrito nesta orientação. Já o Code Assist pago não usa os dados para melhorar o modelo. O mesmo vale ao usar uma chave de API do Gemini em conta pay as you go. Na prática, o alcance do uso de dados sensíveis é um pouco mais brando do que o texto original sugere

    • Concordo com a crítica de que as políticas de privacidade ficam confusas dependendo de como a equipe faz login no Gemini CLI. Para reduzir a controvérsia, foi organizada uma nova documentação com FAQ resumindo de forma clara os termos de serviço e as políticas de dados para cada tipo de conta (link da documentação)

    • O mais frustrante no ecossistema Gemini é justamente a falta de transparência nas políticas de privacidade. O 2.5 Pro é o melhor modelo, então eu gostaria de usá-lo no trabalho, mas as condições de privacidade são tão confusas que acabo operando como se, na prática, não houvesse proteção nenhuma. Isso vale até sendo assinante premium do plano mais caro

    • Mozilla e Google lançaram uma alternativa chamada Gemmafile. O Gemma é uma versão do Gemini totalmente offline, que roda localmente em um único arquivo (open-airgapped), com suporte a execução independente sem dependências. Download Em 2025, 32% das organizações já fizeram implantação real (relatório)

    • A documentação configuration.md do Gemini CLI afirma, na seção "informações que não coletamos", que informações de identificação pessoal, conteúdo de prompts e respostas e conteúdo de arquivos não são armazenados em log

  • O prompt de sistema do Gemini CLI está público neste Gist. As notas pessoais relacionadas estão aqui

    • O Gemini CLI é open source, então dá até para verificar o texto original do prompt de sistema no repositório do Github

    • O prompt de sistema orienta a usar apenas caminhos absolutos, mas o exemplo de arquivo temporário usa caminho relativo

  • Há alguns dias, usei o Claude Code para escrever um webapp simples de acompanhamento de ações em Python com streamlit, seguindo o fluxo do código, e até certo tamanho de projeto ele funcionou muito bem, mas depois desse ponto não conseguiu mais corrigir bugs rapidamente. Fiz a mesma tarefa com o Gemini CLI e, justamente quando o Claude Code começava a se perder, bastou pedir "analise a base de código e corrija todos os bugs" para o app rodar com sucesso. Sensação real de futuro

    • Fico me perguntando se isso acontece por causa da diferença no tamanho da context window. A janela do Gemini é 5 vezes maior que a do Claude. Ao depurar com Claude, em algum momento ele se perde por falta de contexto. Depois pretendo testar isso no ambiente de janela maior do Gemini

    • Hoje, a melhor forma de usar o Claude Code parece ser deixar o trabalho pesado com Gemini 2.5 Pro ou o3/o3pro, e graças ao suporte a MCP é possível conectar os dois modelos com fluidez. Se o Gemini CLI também é open source, parece viável ter plugins para vários modelos. Num futuro em que os LLMs virem commodity, talvez ferramentas em forma de agente CLI virem mais centrais do que wrappers de UI. A OpenAI venceu na disputa por número de usuários, mas como UI para trabalho real o ChatGPT fica atrás

    • Ajuda a compreensão de contexto criar, para cada módulo, um documento markdown resumido com até 100 linhas contendo apenas visão geral do módulo e localização dos arquivos, para que a IA possa navegar por esse conteúdo. Se for difícil resumir nesse formato, então provavelmente também é difícil para um desenvolvedor humano manter. O importante é indicar bem o contexto essencial para a IA

    • Uma engenharia de prompt específica e clara provavelmente traz muito mais produtividade. Pedidos do tipo "corrija todos os bugs" não parecem um cenário muito realista

    • Essa abordagem tende a ruir à medida que a complexidade cresce, e como há muito código duplicado, é bem possível que a eficiência de memória seja péssima. No fim, escrever manualmente talvez seja mais eficiente. Fico curioso se o aumento de código improvisado pode fazer a demanda por DRAM crescer de forma anormal

  • Adicionei pessoalmente uma interface de voz bidirecional ao Gemini CLI.

  • Fica a vontade de que fosse um único binário, como em Go ou Rust, sem necessidade de runtime. É uma pena precisar de runtime do Node

    • Como esse tipo de projeto precisa de atualizações frequentes, faz mais sentido gerenciar via npm ou pip. Não é um programa com exigência extrema de computação ou tamanho, então no hardware moderno isso não é grande problema. Também acho que Go combina muito bem com esse tipo de uso, mas na prática o gerenciamento de bibliotecas acaba sendo mais conveniente assim

    • Também existe a opção de colocar no prompt do Gemini CLI para ele reescrever na linguagem que você quiser

    • Dá mais a impressão de ser um projeto voltado a marketing, no estilo "nós também temos uma ferramenta CLI", do que um produto guiado por qualidade

    • Na prática, a OpenAI também está reconstruindo o Codex CLI em Rust em vez de Typescript, segundo esta matéria. Não tenho tanta experiência com Node, mas a sensação é de que instalação, empacotamento e isolamento estão muito bem resolvidos

    • Talvez seja possível gerar executáveis standalone com Bun e Deno. Explicação do bundler do Bun Explicação da compilação do CLI do Deno. Se for código Node padrão, pelo menos no Bun provavelmente funcionaria bem. Fico curioso sobre como o tamanho do executável se compararia com Go e Rust

  • "Failed to login. Ensure your Google account is not a Workspace account." Fico em dúvida se contas Workspace simplesmente não podem ser usadas. Minha conta é do tempo do GSuite e, no fim, parece que continuo sendo restringido em vários serviços do Google. Desde antigamente eu só precisava de domínio personalizado no Gmail, mas acabei perdendo também dados do YouTube, dados do Fitbit e ainda enfrento bloqueios confusos para escolher serviços por assinatura. No fim, o fato de eu não conseguir usar o Gemini CLI para trabalho de desenvolvimento por causa da conta Workspace soa como falta de consideração com um cliente fiel de longo prazo, e isso decepciona

  • Usei por cerca de 1 mês e, com o desempenho SOTA do 2.5pro e suporte a contexto de 1M tokens, ele é superior à maioria das ferramentas. Mesmo jogando uma base de código grande, consegue analisar e navegar de forma rápida e precisa

    • Quando usei no Cursor, tive um problema em que imports de arquivos Python grandes quebravam. Não tive isso com Claude. Fico curioso se mais alguém teve esse tipo de problema específico com o Gemini

    • Tenho curiosidade sobre o fluxo de trabalho