Google apresenta a IA de texto para vídeo "Imagen Video"
(imagen.research.google)- Um "sistema de geração de vídeo condicionado por texto" que cria vídeos a partir de texto usando um Video Diffusion Model
- O destaque é gerar a partir do texto um vídeo em baixa resolução (24x48 pixels, 16 frames, 3 fps) e depois fazer upscaling por meio de uma cascata de 7 modelos de difusão sobrepostos
- A saída final é de 1280x768 a 24 fps. É possível gerar vídeos com 5,3 segundos de duração
- Artigo: Imagen Video : High Definition Video Generation with Diffusion Models
1 comentários
Imagen - modelo de difusão de text-to-image do Google
Imagen-pytorch - implementação em Pytorch do Google Imagen
Make-A-Video : IA que gera vídeo a partir de texto