1 pontos por GN⁺ 2025-04-17 | 2 comentários | Compartilhar no WhatsApp
  • O Gemini e o Whisk agora oferecem um recurso que transforma prompts de texto em vídeos de 8 segundos em alta resolução
  • Com o modelo Veo 2, é possível gerar vídeos realistas, e o recurso está disponível para assinantes do Google One AI Premium
  • Com o Whisk Animate, é possível transformar imagens em clipes animados de 8 segundos
  • Para segurança, todos os vídeos gerados incluem a marca d'água digital SynthID

Como gerar vídeos no Gemini

  • Veo 2 é um modelo capaz de gerar vídeos detalhados em alta resolução, entendendo física realista e movimento humano para oferecer movimentos de personagens convincentes e cenas realistas
  • Os usuários podem selecionar o Veo 2 no Gemini para gerar clipes de vídeo de 8 segundos em resolução 720p
  • Basta descrever a cena para que o Gemini transforme a ideia em vídeo; quanto mais detalhada for a descrição, maior será o controle sobre o resultado final
  • Os vídeos gerados podem ser compartilhados facilmente em plataformas como TikTok e YouTube Shorts

Dando vida a imagens com o Whisk Animate

  • Whisk é um experimento do Google Labs que permite visualizar novas ideias usando prompts de texto e imagem
  • Com o Whisk Animate, é possível transformar imagens em vídeos vibrantes de 8 segundos, e o recurso está disponível para assinantes do Google One AI Premium

Abordagem de segurança

  • Para garantir a segurança na geração de vídeos, todos os vídeos criados com o Veo 2 incluem a marca d'água digital SynthID
  • Melhorias contínuas serão feitas com base no feedback dos usuários, e avaliações estão em andamento para evitar a geração de conteúdo que viole as políticas

2 comentários

 
GN⁺ 2025-04-17
Comentários do Hacker News
  • O Whisk foi lançado discretamente há alguns meses como uma demo do Imagen 3. Surpreendentemente, é divertido e a implementação é sólida

    • Usa o truque de converter imagens enviadas em descrições de texto
    • Aproveita os pontos fortes do codificador de texto moderno do Imagen 3, capaz de seguir descrições convertidas longas
  • Queria comprar ações de "sim" no evento do Polymarket de que, até 2027, um filme feito por uma única pessoa arrecadará mais de 100 milhões de dólares

  • Gastei US$ 48 em créditos do GCP para gerar 12 vídeos de 8 segundos no Veo2. É bom tomar cuidado

  • Não achei que seria possível gerar vídeos de 8 segundos fora de uma API paga

  • Não sou tão tecnicamente versado nessa área, mas fico me perguntando por que tudo é texto-para-X

    • Acho que talvez fosse possível ter um controle criativo detalhado usando um editor tradicional no estilo keyframe, fazendo um esboço aproximado do terreno, inserindo fotos dos personagens e desenhando splines 3D
  • Fazer anúncios no estilo Ghibli é uma atitude ousada. Eu já achava que esse estilo estaria esgotado a essa altura

  • O Google Vids também usa o Veo 2. Há confusão de produtos

  • A moderação de conteúdo é extremamente frustrante. Esse pode ser o principal motivo pelo qual Veo2 e Gemini vão acabar fracassando

    • Quero fazer um vídeo divertido de uma criança brincando de super-herói, mas continuo fracassando
  • Tudo isso é tecnicamente impressionante, mas há um grande alerta para quem se esforçou muito nessa área

    • Texto-para-qualquer-coisa é muito cansativo. Mesmo que o resultado seja legal, não sinto nada porque não fui eu que fiz
    • Em 97% dos casos, o resultado não é o que eu queria. Se eu mudar um pouco o texto, vem outro resultado errado
    • Todo esse processo drena minha carteira, minha paciência e minha alma
    • Não sei como essas "ferramentas" vão ajudar criadores. Até agora, os produtos que saem dessas ferramentas são só empresas de spam de TikTok/internet genérica
  • O Krita-ai-diffusion, conectado ao Krita e combinando img2img, masking e txt2img, é a ferramenta mais próxima de realmente dar poder aos artistas

  • Em comparação com um ano atrás, é um lançamento muito impressionante. No ML atual, todas as grandes empresas estão competindo entre si e fazendo a tecnologia avançar, o que é uma boa situação. Isso é raro nos EUA (ou de modo geral)