- Framework para controlar o ponto de vista da câmera a partir de uma única imagem RGB usando um modelo de difusão em larga escala
- Embora tenha sido treinado com um conjunto de dados sintético, funciona bem em modo zero-shot também com imagens reais e pinturas impressionistas, sem pré-treinamento adicional
- Usando esse método de difusão para ajustar o ponto de vista, também é possível reconstruir 3D a partir de uma única imagem
- Resultados experimentais qualitativos e quantitativos mostraram que ele oferece desempenho muito superior ao de outros modelos graças ao pré-treinamento em escala de internet
1 comentários
Até o ano passado, eu achava que isso ainda estava longe,
mas ultimamente surge uma nova tecnologia e novos resultados dia sim, dia não..