- Humanos conseguem perceber o mundo 3D mesmo em imagens sem consistência 3D
- O Toon3D consegue recuperar poses de câmera e geometria densa por meio de otimização deformável piecewise-rigid
- Cenas desenhadas à mão não têm consistência 3D, mas com o Toon3D é possível recuperá-las e interpolar novas visualizações nunca vistas antes
Resumo
- Proposta do Toon3D
- Recupera a estrutura 3D subjacente de cenas geometricamente inconsistentes
- Foca em imagens desenhadas à mão de quadrinhos e animações
- Muitos quadrinhos são desenhados diretamente por artistas, sem um motor de renderização 3D
- Imagens desenhadas à mão representam o mundo com fidelidade qualitativa, mas é difícil desenhar múltiplos pontos de vista com consistência 3D
- Pessoas conseguem reconhecer facilmente cenas 3D mesmo com entradas inconsistentes
- Corrige inconsistências em desenhos 2D para que as imagens recém-deformadas fiquem consistentes entre si
- Recupera estrutura densa por meio de uma ferramenta de anotação amigável, estimativa de poses de câmera e deformação de imagem
- Ao deformar as imagens para se ajustarem a um modelo de câmera em perspectiva, pode ser integrado a métodos de reconstrução para gerar novas views
Reconstrução de quadrinhos
- Primeiro recupera poses de câmera e uma nuvem de pontos alinhada
- Inicializa gaussianas a partir da nuvem de pontos densa e otimiza Gaussian Splatting com as câmeras recuperadas
- Inclui regularização de profundidade e foi construído com base no Nerfstudio
- Mostra uma renderização fly-through da cena
Método
- Prevê a profundidade de cada imagem com Marigold e obtém máscaras temporárias candidatas com SAM
- Rotula as imagens com o rotulador Toon3D para obter correspondências e marcar regiões temporárias
- Otimiza as poses de câmera e corrige a distorção das imagens para obter câmeras em perspectiva corrigidas
- Inicializa gaussianas com a nuvem de pontos densa alinhada e executa o refinamento
Rotulador Toon3D
- Mostra duas etapas principais do método
- Vídeo de alinhamento esparso: estimativa aproximada dos parâmetros da câmera
- Vídeo de alinhamento denso: mostra como alinhar em 3D usando várias camadas (câmera, correspondências esparsas, malha de distorção etc.)
Explorando o interior da casa de Rick and Morty
- Reconstrói o interior da casa de Rick and Morty conectando o cômodo por meio da rotulagem de paredes e teto
- O primeiro vídeo mostra a nuvem de pontos, as câmeras e a interface personalizada de rotulagem
- No segundo vídeo, é possível percorrer o interior da casa arrastando o slider
Nuvem de pontos e câmeras
- Mostra a nuvem de pontos e as câmeras recuperadas de 12 cenas de quadrinhos do dataset Toon3D
- É possível explorar a cena clicando nos ícones
Reconstrução com views esparsas
- É possível reconstruir a cena com poucas imagens e grandes mudanças de ponto de vista
- Onde o COLMAP pode falhar, humanos podem intervir com o rotulador Toon3D para obter correspondências anotadas manualmente
- Mostra renderizações fly-through de dois cômodos de um anúncio do Airbnb ("sala de estar" e "quarto 2")
Visualização de inconsistências
- Como os quadrinhos são desenhados à mão, é necessário deformar as imagens para garantir consistência 3D
- Primeiro item: vídeo em que ocorre distorção durante a otimização de alinhamento
- Os dois itens seguintes: imagens mostrando o desenho original, o desenho distorcido e a sobreposição entre ambos
- Áreas borradas indicam onde houve muita distorção
Reconstrução de desenhos
- Também é possível reconstruir ilustrações desenhadas à mão usando Toon3D
- Primeiro prevê a profundidade de cada imagem, depois alinha e deforma a nuvem de pontos
- Por fim, usa refinamento gaussiano para gerar o vídeo
Opinião do GN⁺
- O Toon3D é uma forma inovadora de reconstruir em 3D imagens desenhadas à mão de quadrinhos e animações
- Essa tecnologia oferece uma nova experiência visual e pode ser especialmente útil na produção de animação e no desenvolvimento de jogos
- No entanto, o processo de rotulagem manual pode ser um pouco trabalhoso, e seria bom ver métodos automatizados mais avançados
- Outros projetos com funcionalidades semelhantes incluem COLMAP e Nerfstudio
- Ao adotar essa tecnologia, a rotulagem precisa e a previsão de profundidade são importantes para obter reconstruções 3D mais consistentes
1 comentários
Opinião no Hacker News
Resumo da coletânea de comentários do Hacker News
Exemplo do prédio da Planet Express de Futurama
A diversão de gerar espaços 3D
Possibilidade futura de geração de modelos 3D
Problema da conversão de arte 2D para 3D
Fotogrametria e VR
Necessidade de melhorar o algoritmo
Problema de autoplay de vídeos no site
A reação de Miyazaki
Resultados abaixo das expectativas