(O post original inclui prompt de sistema, snippets de código e gifs)
- Com a atualização do Google AI Studio, foi adicionado um espaço para experimentar vários miniapps (Starter Apps) usando o Gemini
- Dá para executar mais de 10 demos alterando o código. Como usam uma Gemini API Key embutida, é grátis
- Em compensação, se usar demais aparece erro 400. Parece que existe algo como um limite diário de chamadas
- Com outra conta, dá para executar normalmente
Tentando adivinhar: por que o Google divulgou essas demos?
- Recentemente, o Gemini vem chamando atenção por suas capacidades multimodais (multi-modal), que vão além de texto e incluem entender e gerar imagens e vídeos, além de sua excelente habilidade de programação.
- Porém, na maior parte dos casos ele é usado só dentro de chatbots LLM, e não era tão comum pessoas em geral aproveitarem isso no nível de API
- Talvez o Google tenha apresentado essas demos esperando ganhar dinheiro à medida que esses recursos passem a ser bastante usados também via API?
- Afinal, todas as demos funcionam como vitrines mostrando, em nível de código, como implementar esses recursos do Gemini em webapps, integrando-os com outras APIs do Google
Análise dos prompts e do código das demos
Foram analisados dois exemplos mais complexos
Video Toys: entender e explicar vídeos + exemplo de vibe coding
- Demo que analisa vídeos do YouTube com o Gemini 2.5 e cria, via vibe coding, um app simples de material didático interativo
- O vídeo é analisado sob o papel de um "especialista em educação e também product designer, com expertise em criar experiências educacionais em webapps interativos", depois é gerada a especificação do webapp e, por fim, ele é implementado
- O vídeo de exemplo já teve seu conteúdo analisado, então dá para testar o app de material didático imediatamente
- Diferente de outros apps de demo compostos por poucos arquivos, este é feito em React
- O usuário pode editar tanto a especificação para vibe coding gerada pelo Gemini quanto o código produzido
- Recomendado para quem quer criar serviços baseados em vídeo ou serviços que gerem código
Maps Planner: exemplo de multimodal + uso de funções + saída estruturada + API de mapas
- Demo que, ao receber um nome de lugar, explica sobre ele e, ao ativar o Day Planner Mode, monta um roteiro de viagem para um dia inteiro. Também estima o tempo de deslocamento
- Dá suporte a dois modos, General Explorer Mode e Day Planner Mode, com um único prompt de sistema
- Foi interessante ver como o prompt de sistema é ajustado de forma sutil conforme o modo escolhido pelo usuário
- Define funções para entrada e saída precisa de dados de mapa e para desenhar corretamente a linha entre duas localizações, deixando o Gemini chamá-las
- Esse tipo de extensibilidade parece ser exatamente o que se busca alcançar com MCP
- O prompt é bom, mas também mostra muito bem como lidar com API de mapas e dados de localização. Recomendado para quem quer criar serviços relacionados a mapas
Fazendo você mesmo
- É possível copiar os apps de demo e customizá-los. Também há vários templates para quem quer começar do zero
- Foi feita uma cópia da demo de geração de imagens Explain Things with Lots of Tiny Cats para criar uma versão própria
- É uma demo que, quando você pede a explicação de um conceito, cria uma espécie de webtoon usando metáforas com vários gatos
- Chamaram atenção o prompt que faz a geração de imagens continuar (
No commentary, just begin your explanation. Keep going until you're done.) e o código que exibe essas imagens geradas em streaming, uma a uma
- Foi transformada em uma versão em coreano + hipopótamos, criando Hipopótamos sabem de tudo
- Foi usada uma fonte coreana apropriada do Google Fonts, e o HTML e o prompt foram levemente ajustados
- Existe um recurso para compartilhar seu app, mas ele não funciona muito bem
- Como todos os arquivos relacionados ficam salvos no Google Drive, basta ir ao Google Drive e compartilhar os arquivos por lá
Gemini Cookbook
- Enquanto os Starter Apps eram exemplos divertidos de webapps, aqui há diversos exemplos em Python
- Inclusive já existem exemplos do Gemini 2.5 Flash, divulgados há poucas horas
- É uma boa referência para quem pretende criar serviços de IA generativa
Ainda não há comentários.