13 pontos por spilist2 2025-04-18 | Ainda não há comentários. | Compartilhar no WhatsApp

(O post original inclui prompt de sistema, snippets de código e gifs)

  • Com a atualização do Google AI Studio, foi adicionado um espaço para experimentar vários miniapps (Starter Apps) usando o Gemini
  • Dá para executar mais de 10 demos alterando o código. Como usam uma Gemini API Key embutida, é grátis
    • Em compensação, se usar demais aparece erro 400. Parece que existe algo como um limite diário de chamadas
    • Com outra conta, dá para executar normalmente

Tentando adivinhar: por que o Google divulgou essas demos?

  • Recentemente, o Gemini vem chamando atenção por suas capacidades multimodais (multi-modal), que vão além de texto e incluem entender e gerar imagens e vídeos, além de sua excelente habilidade de programação.
  • Porém, na maior parte dos casos ele é usado só dentro de chatbots LLM, e não era tão comum pessoas em geral aproveitarem isso no nível de API
  • Talvez o Google tenha apresentado essas demos esperando ganhar dinheiro à medida que esses recursos passem a ser bastante usados também via API?
    • Afinal, todas as demos funcionam como vitrines mostrando, em nível de código, como implementar esses recursos do Gemini em webapps, integrando-os com outras APIs do Google

Análise dos prompts e do código das demos

Foram analisados dois exemplos mais complexos

Video Toys: entender e explicar vídeos + exemplo de vibe coding

  • Demo que analisa vídeos do YouTube com o Gemini 2.5 e cria, via vibe coding, um app simples de material didático interativo
    • O vídeo é analisado sob o papel de um "especialista em educação e também product designer, com expertise em criar experiências educacionais em webapps interativos", depois é gerada a especificação do webapp e, por fim, ele é implementado
  • O vídeo de exemplo já teve seu conteúdo analisado, então dá para testar o app de material didático imediatamente
  • Diferente de outros apps de demo compostos por poucos arquivos, este é feito em React
  • O usuário pode editar tanto a especificação para vibe coding gerada pelo Gemini quanto o código produzido
  • Recomendado para quem quer criar serviços baseados em vídeo ou serviços que gerem código

Maps Planner: exemplo de multimodal + uso de funções + saída estruturada + API de mapas

  • Demo que, ao receber um nome de lugar, explica sobre ele e, ao ativar o Day Planner Mode, monta um roteiro de viagem para um dia inteiro. Também estima o tempo de deslocamento
  • Dá suporte a dois modos, General Explorer Mode e Day Planner Mode, com um único prompt de sistema
    • Foi interessante ver como o prompt de sistema é ajustado de forma sutil conforme o modo escolhido pelo usuário
  • Define funções para entrada e saída precisa de dados de mapa e para desenhar corretamente a linha entre duas localizações, deixando o Gemini chamá-las
    • Esse tipo de extensibilidade parece ser exatamente o que se busca alcançar com MCP
  • O prompt é bom, mas também mostra muito bem como lidar com API de mapas e dados de localização. Recomendado para quem quer criar serviços relacionados a mapas

Fazendo você mesmo

  • É possível copiar os apps de demo e customizá-los. Também há vários templates para quem quer começar do zero
  • Foi feita uma cópia da demo de geração de imagens Explain Things with Lots of Tiny Cats para criar uma versão própria
    • É uma demo que, quando você pede a explicação de um conceito, cria uma espécie de webtoon usando metáforas com vários gatos
    • Chamaram atenção o prompt que faz a geração de imagens continuar (No commentary, just begin your explanation. Keep going until you're done.) e o código que exibe essas imagens geradas em streaming, uma a uma
  • Foi transformada em uma versão em coreano + hipopótamos, criando Hipopótamos sabem de tudo
    • Foi usada uma fonte coreana apropriada do Google Fonts, e o HTML e o prompt foram levemente ajustados
  • Existe um recurso para compartilhar seu app, mas ele não funciona muito bem
    • Como todos os arquivos relacionados ficam salvos no Google Drive, basta ir ao Google Drive e compartilhar os arquivos por lá

Gemini Cookbook

  • Enquanto os Starter Apps eram exemplos divertidos de webapps, aqui há diversos exemplos em Python
    • Inclusive já existem exemplos do Gemini 2.5 Flash, divulgados há poucas horas
  • É uma boa referência para quem pretende criar serviços de IA generativa

Ainda não há comentários.

Ainda não há comentários.