- O Gemini e o Whisk agora oferecem um recurso que transforma prompts de texto em vídeos de 8 segundos em alta resolução
- Com o modelo Veo 2, é possível gerar vídeos realistas, e o recurso está disponível para assinantes do Google One AI Premium
- Com o Whisk Animate, é possível transformar imagens em clipes animados de 8 segundos
- Para segurança, todos os vídeos gerados incluem a marca d'água digital SynthID
Como gerar vídeos no Gemini
- Veo 2 é um modelo capaz de gerar vídeos detalhados em alta resolução, entendendo física realista e movimento humano para oferecer movimentos de personagens convincentes e cenas realistas
- Os usuários podem selecionar o Veo 2 no Gemini para gerar clipes de vídeo de 8 segundos em resolução 720p
- Basta descrever a cena para que o Gemini transforme a ideia em vídeo; quanto mais detalhada for a descrição, maior será o controle sobre o resultado final
- Os vídeos gerados podem ser compartilhados facilmente em plataformas como TikTok e YouTube Shorts
Dando vida a imagens com o Whisk Animate
- Whisk é um experimento do Google Labs que permite visualizar novas ideias usando prompts de texto e imagem
- Com o Whisk Animate, é possível transformar imagens em vídeos vibrantes de 8 segundos, e o recurso está disponível para assinantes do Google One AI Premium
Abordagem de segurança
- Para garantir a segurança na geração de vídeos, todos os vídeos criados com o Veo 2 incluem a marca d'água digital SynthID
- Melhorias contínuas serão feitas com base no feedback dos usuários, e avaliações estão em andamento para evitar a geração de conteúdo que viole as políticas
2 comentários
Google DeepMind anuncia o modelo de geração de vídeo Veo 2
Comentários do Hacker News
O Whisk foi lançado discretamente há alguns meses como uma demo do Imagen 3. Surpreendentemente, é divertido e a implementação é sólida
Queria comprar ações de "sim" no evento do Polymarket de que, até 2027, um filme feito por uma única pessoa arrecadará mais de 100 milhões de dólares
Gastei US$ 48 em créditos do GCP para gerar 12 vídeos de 8 segundos no Veo2. É bom tomar cuidado
Não achei que seria possível gerar vídeos de 8 segundos fora de uma API paga
Não sou tão tecnicamente versado nessa área, mas fico me perguntando por que tudo é texto-para-X
Fazer anúncios no estilo Ghibli é uma atitude ousada. Eu já achava que esse estilo estaria esgotado a essa altura
O Google Vids também usa o Veo 2. Há confusão de produtos
A moderação de conteúdo é extremamente frustrante. Esse pode ser o principal motivo pelo qual Veo2 e Gemini vão acabar fracassando
Tudo isso é tecnicamente impressionante, mas há um grande alerta para quem se esforçou muito nessa área
O Krita-ai-diffusion, conectado ao Krita e combinando img2img, masking e txt2img, é a ferramenta mais próxima de realmente dar poder aos artistas
Em comparação com um ano atrás, é um lançamento muito impressionante. No ML atual, todas as grandes empresas estão competindo entre si e fazendo a tecnologia avançar, o que é uma boa situação. Isso é raro nos EUA (ou de modo geral)