Google anuncia o Gemini CLI GitHub Actions

(blog.google)

5 pontos por GN⁺ 2025-08-09 | 1 comentários | Compartilhar no WhatsApp

O Google anunciou o Gemini CLI GitHub Actions, baseado no Gemini CLI, para suportar a colaboração em equipe em repositórios do GitHub
- O Gemini CLI é um agente de IA de código aberto que permite usar recursos de IA no terminal
- Esta versão do GitHub Actions foi projetada para ambientes de colaboração em equipe, como se fosse um colega de IA residente no repositório
A ferramenta é gratuita e de código aberto e está disponível globalmente em versão beta
É executada automaticamente de forma assíncrona conforme eventos ocorridos no repositório do GitHub (como criação de novas issues e PRs) e processa tarefas automaticamente, entendendo o contexto completo do projeto
Oferece 3 fluxos de trabalho de código aberto poderosos
- Triagem inteligente de issues (Intelligent issue triage)
  - Analisa novas issues e atribui automaticamente rótulos e prioridades
  - Ajuda desenvolvedores a se concentrarem em tarefas importantes
- Revisões aceleradas de pull requests (Accelerated pull request reviews)
  - Fornece feedback imediato e aprofundado sobre mudanças de código
  - Revisa qualidade, estilo e precisão do código para reduzir a carga do revisor
- Colaboração sob demanda (On-demand collaboration)
  - É possível delegar tarefas mencionando @gemini-cli em uma issue ou PR
  - Ex.: "escrever testes para este bug", "implementar a sugestão acima", "fazer brainstorming de uma solução alternativa", "corrigir um bug com requisitos claramente definidos"
Considere esses fluxos de trabalho como um ponto de partida: por serem open source, é possível montar workflows personalizados
Ao automatizar tarefas repetitivas e que consomem muito tempo, melhora a produtividade de desenvolvimento e aumenta a eficiência da revisão de código e da gestão de issues, com potencial para acelerar a colaboração entre equipes

1 comentários

GN⁺ 2025-08-09

Comentários do Hacker News

Isso me deixa confuso porque não dá para distinguir se isso é um CLI, uma GitHub Action ou até um GitHub Application
O Jules originalmente era chamado de "coding agent", então não sei se agora outra ferramenta assumiu esse papel ou se é só mais um caso de canibalização da própria Google
Sinto que essa empresa precisa de uma liderança com uma visão mais clara
Mesmo tendo trabalhado 13 anos escrevendo código para Android, colaborado com a Google, sido líder em comunidades e conferências de desenvolvedores do Google, conversado com muitos GDEs e usado a Gemini API em produtos, ainda é difícil entender do que se trata
Do ponto de vista de usuário comum, deve ser praticamente impossível entender
Existem duas SDKs para integração da Gemini API e a documentação está toda espalhada; para uma funcionalidade específica, você precisa pesquisar no Google e fuçar repositório de código
A maioria das funções que você quer fica com rate limit ou só aberta para testadores em modo privado
E há 3 coding agents
Embora haja acesso à conta do Google e ao telefone, o app Gemini é inútil
Até tarefas básicas como adicionar uma service account no Google Cloud têm UX confuso
A única coisa realmente usável é o AI Studio. Dá para experimentar vários modelos e a experiência para emissão de chave da Gemini API melhorou
Honestamente, é difícil aplaudir esse lançamento; no fundo é só um produto novo em nível “mediano”
- Sinto que precisa existir uma linha clara entre cultura de pesquisa e cultura de software
  No ambiente de pesquisa, o caos de várias equipes fazendo experimentos simultâneos pode até ser positivo,
  mas software e produto que chega ao cliente exige uma abordagem diferente
- A Google parece criar vários espaços de “incubação”, e quando alguns crescem, eles não se integram naturalmente aos produtos existentes, o que confunde os usuários
  O caso do NotebookLLM também existe
  Mas, pessoalmente, acho que esse tipo de experimento é melhor
  A equipe do NotebookLLM parecia trabalhar com bastante autonomia
- O ponto mais engraçado é que, mesmo com acesso à conta do Google e às infos do telefone, o app Gemini não faz nada
  Ao abrir o app, ele diz: “Hello, Vasco”, mas se eu pergunto “Qual é o meu nome?”, responde que não consegue acessar meus dados de usuário
  Eu entendo por que isso acontece, mas é uma situação muito engraçada
- O Jules roda de forma assíncrona numa VM e em checkout separado do código
  O Gemini CLI roda de forma síncrona localmente com o usuário (exceto no modo YOLO)
  São mecanismos totalmente diferentes
- No caso do Google Workspace, ativar o Gemini CLI em toda a organização é uma tarefa de emoções mistas
  Explicação detalhada
Entendo que a Google queira competir no mercado de AI para coding, mas isso levanta um monte de coisas estranhas
- A Gemini não consegue nem fazer uma agenda simples de reunião no calendário
- No Google Docs ela não faz edição colaborativa; só consegue inserir conteúdo
- Não existe um ponto central (MCP) para gerenciar Docs ou Sheets
- A ajuda de fórmulas do Sheets é até pior que a do Google Search
  São vários domínios bem específicos nos quais ela ainda não se destaca como IA
  Outro exemplo: antes, no Gmail, quando eu buscava exatamente a palavra "remarkable", ela trazia resultados até com "amazing" e outros termos relacionados
  Em todos os produtos a busca deu uma impressão de retrocesso frustrante
- Na prática, vi no meu celular Android um e-mail de confirmação de entrega; ao apertar e segurar o botão de ligar, o Gemini aparece em pop-up
  Ele puxa o contexto da tela e, se eu falo "coloque isso no meu calendário", o evento é adicionado
  Não funciona perfeitamente (às vezes falha em eventos de múltiplos dias ou com localização estranha), mas está melhorando
  Se você for cliente Google Workspace, também há integração entre Gemini web app, Calendar e Drive
  Várias tarefas como resumo de documentos também funcionam
  Então o negócio de "não dá para criar eventos" não é exatamente verdade
- Penso que a razão de a Google não "abrir" o Gemini totalmente nos documentos pode ser semelhante ao motivo de a Apple não abrir IA no iPhone
  A confiabilidade ainda não é absoluta o suficiente para estar pronta para os 99,99% do público
  É um sistema que só os early adopters de tecnologia usam bem; para usuários comuns, eu não recomendaria
- Há um monte de usos pequenos e úteis, mas o marketing deixa a desejar
  Por exemplo, eu peço para tirar uma foto da lista de compras e pedir ao Gemini para transformar em formato colável, e ele só transfere direto para o Google Keep sem classificar por categoria
  Se o time desse um pouco mais de prioridade para lapidar isso, ficaria muito mais útil
  A OpenAI faz bastante marketing de recursos no TikTok, enquanto muita gente abaixo de 30 nem sabe que o Gemini existe
  Na prática, sinto que o Gemini é mais útil que o ChatGPT, mas o marketing é insuficiente
- O suporte ao Google Docs é tão limitado que mal gera expectativa
- Minha percepção é que a busca foi trocada para algo só baseado em embedding e por isso não funciona direito
  Na prática, seria necessário um search híbrido com embedding, matching de texto e vetores de qualidade, e não é trivial escalar isso rápido
  Se alguém tiver um sistema desse tipo, seria bom compartilhar
Para entender o que o serviço realmente é, precisa de bastante tempo
Tirando frases de marketing, texto prolixo e terminologia desnecessária, a cara real aparece
Na minha leitura, isso é uma GitHub Action
É um wrapper que é colocado num arquivo YAML de GitHub workflow para executar o Gemini CLI e passar prompt, contexto do repositório e dados de eventos (como issue ou diff de PR), fazendo respostas ou ações
Permite leitura/escrita dos dados do repositório via token ou app pela GitHub API (adicionar labels, comentar, sugerir código etc)
Usa chamadas padrão do endpoint HTTPS da API do Gemini LLM
- Existe um vídeo do Boris Cherny e Catherine Wu no podcast Latent Space falando de linting semântico em CLI baseado em IA
  Entrevista no YouTube relacionada
  Eu ainda não usei CLI com IA de forma ativa em CI/CD, mas o conceito de tarefas "semântico pass/fail" me interessa bastante
- O documento diz "use isso na interface de chat", mas fica a dúvida: o que exatamente é essa interface de chat
Os planos do Gemini (por exemplo, Google One, Workspace etc.) parecem aplicáveis só a produtos baseados na web, e ficam de fora os baseados em API (como Gemini CLI)
Se um único plano mensal para desenvolvedores desse acesso ao CLI, github action, Gemini chat, Jules etc, isso seria algo realmente revolucionário
Quero muito um modelo de assinatura única tipo Claude
- Entender a própria estrutura de assinatura já precisa de IA
- O tier gratuito do Gemini é realmente confuso
  Testei com vários agentes e já dava rate limit em 5 ou 6 requisições
  Já no app web, parece que dá para usar sem limite
  Dizem que há uma "alocação gratuita generosa", mas na prática trava em pouco tempo
  Até serve para testes simples, mas fica aquém para trabalho real
No texto da imagem do slide promocional,
a frase dizendo que, com a tag "@mini-cli", dá para delegar tarefas do bug até a correção parece muito engraçada
- É surpreendente que aquela frase ainda não tenha sido corrigida
  Talvez seja a forma mais honesta de falar
- Fico em dúvida se faz sentido chamar isso de "gemini cli"
  A maioria das operações é via GitHub, então talvez já não seja mais um CLI
  Talvez um nome mais intuitivo, como "gemini github action" ou "run gemini", fosse melhor, parecido com o Claude Code
- Acho que o time do Gemini CLI pode ter batizado assim para dar crédito ao time ou por pressão interna para não parecer um produto genérico demais
- Na prática, a estrutura é instalar o gemini-cli dentro do VM do github action e passar o comentário da issue/PR como prompt para ele
- Eu também tive o mesmo dilema sobre nomenclatura
  Esse é realmente um ponto decepcionante pra mim
- É um tipo de add-on para o Gemini CLI usado totalmente localmente
No ano passado, desenvolvi de fato uma plataforma de bounty para PRs no GitHub
Devido aos incentivos, vieram muitos PRs de baixa qualidade, e como a IA facilita muito escrever rascunhos, esse conceito virou quase sem sentido
A preocupação central da manutenção open source acabou migrando para a limitação de recursos de revisores/maintainers
Então estou experimentando uma framework que gera automaticamente PRs a partir de agentes principais para otimizar revisão e aprovação/edição
Aqui está um estudo de caso relacionado
Muita configuração é necessária, e comparado com o GitHub Copilot Agent (que já é fácil para qualquer pessoa usar), o apelo fica muito fraco
O Gemini Assistant precisa ser claramente melhor que as ferramentas atuais para ter alguma chance de atrair usuários
- Em relação a qual assistente atual é muito superior, queria saber se você está se referindo ao Claude
  Se o Gemini chegar perto disso, basta uma assinatura clara e razoável
O fato de isso aparentemente ser realmente gratuito até parece suspeito
O uso dos dados de treino pode ser o custo implícito, e como não existe opção de opt-out, acho que vale usar com cautela em repositórios pessoais ou internos
Tenho conseguido bons resultados com o Copilot Agent
Às vezes preciso fechar PRs e ajustar issues, ou trabalhar localmente no Cursor, mas o início da tarefa ficou tão rápido que a satisfação geral é alta

Google anuncia o Gemini CLI GitHub Actions

Leituras relacionadas

1 comentários

Comentários do Hacker News