Stable Video 3D: síntese de novas visualizações de alta qualidade e geração 3D a partir de uma única imagem
- Lançamento do Stable Video 3D (SV3D), um modelo generativo baseado no Stable Video Diffusion. A qualidade do vídeo e a consistência entre visualizações foram muito aprimoradas
- Inclui duas variantes: SV3D_u e SV3D_p
- O SV3D_u gera um vídeo orbital com base na entrada de uma única imagem, sem condicionamento de câmera
- O SV3D_p amplia a funcionalidade para aceitar uma única imagem e também visualizações orbitais, gerando vídeo 3D ao longo de um caminho de câmera especificado
- O Stable Video 3D pode ser usado para fins comerciais por meio da assinatura da Stability AI e, para uso não comercial, é possível baixar os pesos do modelo no Hugging Face e consultar o artigo de pesquisa
Vantagens do Video Diffusion
- Ao aplicar o modelo de difusão image-to-video Stable Video Diffusion com a adição de condicionamento de caminho de câmera, o Stable Video 3D consegue gerar vídeos multiview de objetos
- O uso de um modelo de Video Diffusion oferece vantagens importantes em termos de generalização dos resultados gerados e consistência entre visualizações, em comparação com o modelo de difusão de imagem usado no Stable Zero123
- Além disso, aproveitando os recursos robustos do Stable Video 3D, é proposta uma otimização 3D aprimorada para gerar órbitas arbitrárias ao redor de objetos
Geração de novas visualizações
- O SV3D introduz avanços importantes especialmente em síntese de novas visualizações (NVS)
- Enquanto abordagens anteriores frequentemente enfrentavam limitações de perspectiva e inconsistências nos resultados, o SV3D fornece visualizações consistentes em qualquer ângulo fornecido
- Essa capacidade não apenas melhora o controle de pose, mas também garante aparência consistente do objeto em múltiplas visualizações, aprimorando ainda mais um aspecto essencial da geração 3D realista e precisa
Geração 3D
- O SV3D aproveita a consistência multiview para otimizar campos de radiância neural 3D (NeRF) e representações em malha, melhorando a qualidade de malhas 3D geradas diretamente a partir de novas visualizações
- Para isso, foi projetada uma perda de amostragem por destilação com pontuação de máscara para melhorar ainda mais a qualidade 3D de áreas invisíveis nas visualizações previstas
- Além disso, o SV3D usa um modelo de iluminação separado, otimizado junto com a forma 3D e a textura, para reduzir o problema de iluminação embutida
1 comentários
Comentários do Hacker News