5 pontos por GN⁺ 2025-08-09 | 1 comentários | Compartilhar no WhatsApp
  • O Google anunciou o Gemini CLI GitHub Actions, baseado no Gemini CLI, para suportar a colaboração em equipe em repositórios do GitHub
    • O Gemini CLI é um agente de IA de código aberto que permite usar recursos de IA no terminal
    • Esta versão do GitHub Actions foi projetada para ambientes de colaboração em equipe, como se fosse um colega de IA residente no repositório
  • A ferramenta é gratuita e de código aberto e está disponível globalmente em versão beta
  • É executada automaticamente de forma assíncrona conforme eventos ocorridos no repositório do GitHub (como criação de novas issues e PRs) e processa tarefas automaticamente, entendendo o contexto completo do projeto
  • Oferece 3 fluxos de trabalho de código aberto poderosos
    • Triagem inteligente de issues (Intelligent issue triage)
      • Analisa novas issues e atribui automaticamente rótulos e prioridades
      • Ajuda desenvolvedores a se concentrarem em tarefas importantes
    • Revisões aceleradas de pull requests (Accelerated pull request reviews)
      • Fornece feedback imediato e aprofundado sobre mudanças de código
      • Revisa qualidade, estilo e precisão do código para reduzir a carga do revisor
    • Colaboração sob demanda (On-demand collaboration)
      • É possível delegar tarefas mencionando @gemini-cli em uma issue ou PR
      • Ex.: "escrever testes para este bug", "implementar a sugestão acima", "fazer brainstorming de uma solução alternativa", "corrigir um bug com requisitos claramente definidos"
  • Considere esses fluxos de trabalho como um ponto de partida: por serem open source, é possível montar workflows personalizados
  • Ao automatizar tarefas repetitivas e que consomem muito tempo, melhora a produtividade de desenvolvimento e aumenta a eficiência da revisão de código e da gestão de issues, com potencial para acelerar a colaboração entre equipes

1 comentários

 
GN⁺ 2025-08-09
Comentários do Hacker News
  • Isso me deixa confuso porque não dá para distinguir se isso é um CLI, uma GitHub Action ou até um GitHub Application
    O Jules originalmente era chamado de "coding agent", então não sei se agora outra ferramenta assumiu esse papel ou se é só mais um caso de canibalização da própria Google
    Sinto que essa empresa precisa de uma liderança com uma visão mais clara
    Mesmo tendo trabalhado 13 anos escrevendo código para Android, colaborado com a Google, sido líder em comunidades e conferências de desenvolvedores do Google, conversado com muitos GDEs e usado a Gemini API em produtos, ainda é difícil entender do que se trata
    Do ponto de vista de usuário comum, deve ser praticamente impossível entender
    Existem duas SDKs para integração da Gemini API e a documentação está toda espalhada; para uma funcionalidade específica, você precisa pesquisar no Google e fuçar repositório de código
    A maioria das funções que você quer fica com rate limit ou só aberta para testadores em modo privado
    E há 3 coding agents
    Embora haja acesso à conta do Google e ao telefone, o app Gemini é inútil
    Até tarefas básicas como adicionar uma service account no Google Cloud têm UX confuso
    A única coisa realmente usável é o AI Studio. Dá para experimentar vários modelos e a experiência para emissão de chave da Gemini API melhorou
    Honestamente, é difícil aplaudir esse lançamento; no fundo é só um produto novo em nível “mediano”

    • Sinto que precisa existir uma linha clara entre cultura de pesquisa e cultura de software
      No ambiente de pesquisa, o caos de várias equipes fazendo experimentos simultâneos pode até ser positivo,
      mas software e produto que chega ao cliente exige uma abordagem diferente

    • A Google parece criar vários espaços de “incubação”, e quando alguns crescem, eles não se integram naturalmente aos produtos existentes, o que confunde os usuários
      O caso do NotebookLLM também existe
      Mas, pessoalmente, acho que esse tipo de experimento é melhor
      A equipe do NotebookLLM parecia trabalhar com bastante autonomia

    • O ponto mais engraçado é que, mesmo com acesso à conta do Google e às infos do telefone, o app Gemini não faz nada
      Ao abrir o app, ele diz: “Hello, Vasco”, mas se eu pergunto “Qual é o meu nome?”, responde que não consegue acessar meus dados de usuário
      Eu entendo por que isso acontece, mas é uma situação muito engraçada

    • O Jules roda de forma assíncrona numa VM e em checkout separado do código
      O Gemini CLI roda de forma síncrona localmente com o usuário (exceto no modo YOLO)
      São mecanismos totalmente diferentes

    • No caso do Google Workspace, ativar o Gemini CLI em toda a organização é uma tarefa de emoções mistas
      Explicação detalhada

  • Entendo que a Google queira competir no mercado de AI para coding, mas isso levanta um monte de coisas estranhas

    • A Gemini não consegue nem fazer uma agenda simples de reunião no calendário

    • No Google Docs ela não faz edição colaborativa; só consegue inserir conteúdo

    • Não existe um ponto central (MCP) para gerenciar Docs ou Sheets

    • A ajuda de fórmulas do Sheets é até pior que a do Google Search
      São vários domínios bem específicos nos quais ela ainda não se destaca como IA
      Outro exemplo: antes, no Gmail, quando eu buscava exatamente a palavra "remarkable", ela trazia resultados até com "amazing" e outros termos relacionados
      Em todos os produtos a busca deu uma impressão de retrocesso frustrante

    • Na prática, vi no meu celular Android um e-mail de confirmação de entrega; ao apertar e segurar o botão de ligar, o Gemini aparece em pop-up
      Ele puxa o contexto da tela e, se eu falo "coloque isso no meu calendário", o evento é adicionado
      Não funciona perfeitamente (às vezes falha em eventos de múltiplos dias ou com localização estranha), mas está melhorando
      Se você for cliente Google Workspace, também há integração entre Gemini web app, Calendar e Drive
      Várias tarefas como resumo de documentos também funcionam
      Então o negócio de "não dá para criar eventos" não é exatamente verdade

    • Penso que a razão de a Google não "abrir" o Gemini totalmente nos documentos pode ser semelhante ao motivo de a Apple não abrir IA no iPhone
      A confiabilidade ainda não é absoluta o suficiente para estar pronta para os 99,99% do público
      É um sistema que só os early adopters de tecnologia usam bem; para usuários comuns, eu não recomendaria

    • Há um monte de usos pequenos e úteis, mas o marketing deixa a desejar
      Por exemplo, eu peço para tirar uma foto da lista de compras e pedir ao Gemini para transformar em formato colável, e ele só transfere direto para o Google Keep sem classificar por categoria
      Se o time desse um pouco mais de prioridade para lapidar isso, ficaria muito mais útil
      A OpenAI faz bastante marketing de recursos no TikTok, enquanto muita gente abaixo de 30 nem sabe que o Gemini existe
      Na prática, sinto que o Gemini é mais útil que o ChatGPT, mas o marketing é insuficiente

    • O suporte ao Google Docs é tão limitado que mal gera expectativa

    • Minha percepção é que a busca foi trocada para algo só baseado em embedding e por isso não funciona direito
      Na prática, seria necessário um search híbrido com embedding, matching de texto e vetores de qualidade, e não é trivial escalar isso rápido
      Se alguém tiver um sistema desse tipo, seria bom compartilhar

  • Para entender o que o serviço realmente é, precisa de bastante tempo
    Tirando frases de marketing, texto prolixo e terminologia desnecessária, a cara real aparece
    Na minha leitura, isso é uma GitHub Action
    É um wrapper que é colocado num arquivo YAML de GitHub workflow para executar o Gemini CLI e passar prompt, contexto do repositório e dados de eventos (como issue ou diff de PR), fazendo respostas ou ações
    Permite leitura/escrita dos dados do repositório via token ou app pela GitHub API (adicionar labels, comentar, sugerir código etc)
    Usa chamadas padrão do endpoint HTTPS da API do Gemini LLM

    • Existe um vídeo do Boris Cherny e Catherine Wu no podcast Latent Space falando de linting semântico em CLI baseado em IA
      Entrevista no YouTube relacionada
      Eu ainda não usei CLI com IA de forma ativa em CI/CD, mas o conceito de tarefas "semântico pass/fail" me interessa bastante

    • O documento diz "use isso na interface de chat", mas fica a dúvida: o que exatamente é essa interface de chat

  • Os planos do Gemini (por exemplo, Google One, Workspace etc.) parecem aplicáveis só a produtos baseados na web, e ficam de fora os baseados em API (como Gemini CLI)
    Se um único plano mensal para desenvolvedores desse acesso ao CLI, github action, Gemini chat, Jules etc, isso seria algo realmente revolucionário
    Quero muito um modelo de assinatura única tipo Claude

    • Entender a própria estrutura de assinatura já precisa de IA

    • O tier gratuito do Gemini é realmente confuso
      Testei com vários agentes e já dava rate limit em 5 ou 6 requisições
      Já no app web, parece que dá para usar sem limite
      Dizem que há uma "alocação gratuita generosa", mas na prática trava em pouco tempo
      Até serve para testes simples, mas fica aquém para trabalho real

  • No texto da imagem do slide promocional,
    a frase dizendo que, com a tag "@mini-cli", dá para delegar tarefas do bug até a correção parece muito engraçada

    • É surpreendente que aquela frase ainda não tenha sido corrigida
      Talvez seja a forma mais honesta de falar

    • Fico em dúvida se faz sentido chamar isso de "gemini cli"
      A maioria das operações é via GitHub, então talvez já não seja mais um CLI
      Talvez um nome mais intuitivo, como "gemini github action" ou "run gemini", fosse melhor, parecido com o Claude Code

    • Acho que o time do Gemini CLI pode ter batizado assim para dar crédito ao time ou por pressão interna para não parecer um produto genérico demais

    • Na prática, a estrutura é instalar o gemini-cli dentro do VM do github action e passar o comentário da issue/PR como prompt para ele

    • Eu também tive o mesmo dilema sobre nomenclatura
      Esse é realmente um ponto decepcionante pra mim

    • É um tipo de add-on para o Gemini CLI usado totalmente localmente

  • No ano passado, desenvolvi de fato uma plataforma de bounty para PRs no GitHub
    Devido aos incentivos, vieram muitos PRs de baixa qualidade, e como a IA facilita muito escrever rascunhos, esse conceito virou quase sem sentido
    A preocupação central da manutenção open source acabou migrando para a limitação de recursos de revisores/maintainers
    Então estou experimentando uma framework que gera automaticamente PRs a partir de agentes principais para otimizar revisão e aprovação/edição
    Aqui está um estudo de caso relacionado

  • Muita configuração é necessária, e comparado com o GitHub Copilot Agent (que já é fácil para qualquer pessoa usar), o apelo fica muito fraco
    O Gemini Assistant precisa ser claramente melhor que as ferramentas atuais para ter alguma chance de atrair usuários

    • Em relação a qual assistente atual é muito superior, queria saber se você está se referindo ao Claude
      Se o Gemini chegar perto disso, basta uma assinatura clara e razoável
  • O fato de isso aparentemente ser realmente gratuito até parece suspeito
    O uso dos dados de treino pode ser o custo implícito, e como não existe opção de opt-out, acho que vale usar com cautela em repositórios pessoais ou internos

  • Tenho conseguido bons resultados com o Copilot Agent
    Às vezes preciso fechar PRs e ajustar issues, ou trabalhar localmente no Cursor, mas o início da tarefa ficou tão rápido que a satisfação geral é alta