3D Gaussian Splatting como Cadeias de Markov Monte Carlo

(ubc-vision.github.io)

1 pontos por GN⁺ 2024-06-20 | 1 comentários | Compartilhar no WhatsApp

Convertendo 3D Gaussian Splatting em Cadeias de Markov Monte Carlo

Visão geral

O 3D Gaussian Splatting vem ganhando popularidade em renderização neural.
Os métodos existentes dependem de estratégias complexas de clonagem e divisão para posicionar os gaussianos.
Esses métodos podem ter queda de qualidade dependendo da inicialização.

Nova abordagem

Trata os gaussianos 3D como amostras aleatórias extraídas de uma distribuição de probabilidade que descreve a representação física da cena.
Com isso, a atualização dos gaussianos 3D é convertida em uma atualização de descida estocástica de gradiente com ruído (SGLD) simplesmente pela introdução de ruído.
Reescreve as estratégias existentes de densificação e poda como transições determinísticas de estado de amostras MCMC.

Principais técnicas

Modifica a “clonagem” dos gaussianos para um método de realocação que preserva aproximadamente a probabilidade das amostras.
Introduz uma regularização que remove gaussianos não utilizados, promovendo o uso eficiente dos gaussianos.

Resultados

Entrega melhor qualidade de renderização em várias cenas padrão de avaliação.
Permite controlar facilmente o número de gaussianos.
Mostra robustez em relação à inicialização.

Opinião do GN⁺

Este artigo apresenta uma nova abordagem para 3D Gaussian Splatting, reduzindo a dependência da inicialização e melhorando a qualidade.
É interessante o uso de Cadeias de Markov Monte Carlo (MCMC) e descida estocástica de gradiente com ruído (SGLD).
Essa técnica pode ajudar a gerar imagens de melhor qualidade na área de renderização neural.
Ao oferecer robustez em relação à inicialização, aumenta o potencial de aplicações práticas.
Vale analisar as vantagens e desvantagens em comparação com outras técnicas de renderização neural.

1 comentários

GN⁺ 2024-06-20

Comentário do Hacker News

É bom que a técnica original de 3DGS seja inicializada com uma nuvem de pontos gerada usando o processo tradicional do COLMAP.
Os resultados do artigo são bons, e gosto de haver uma base formal melhor para como escolher as posições dos splats, mas não entendo o que a imagem no topo representa.
Gaussian splatting é uma técnica muito impressionante e, no momento, é a melhor forma de mostrar cenas fotorrealistas em VR. Espero que surjam mais casos de uso práticos.
Quero deixar claro se a principal diferença deste artigo é adicionar uma pequena quantidade de ruído a cada atualização. Li o artigo inteiro, mas ainda não tenho certeza.
Fico me perguntando quais seriam as aplicações “para o consumidor” do 3D splatting. Parece muito legal, mas não entendo se isso vai se tornar uma tecnologia para o usuário final.
Uma pena que o PDF não use hyperref. Seria mais conveniente clicar nos links e ir até as referências citadas.
Mais um artigo baseado no método da Inria (licença não comercial), e existem várias alternativas open source.
Não entendi o texto.
Diferentemente das abordagens existentes de 3D Gaussian splatting, interpretamos o processo de treinamento de posicionar e otimizar gaussianas como um processo de amostragem. Fico me perguntando qual é a diferença prática. O próprio MCMC faz amostragem em probabilidades mais altas; então, será que isso apenas faz mais amostragem na extremidade inferior da distribuição, ou será que formaliza o algoritmo anterior para facilitar a manipulação de vários parâmetros?

3D Gaussian Splatting como Cadeias de Markov Monte Carlo

Convertendo 3D Gaussian Splatting em Cadeias de Markov Monte Carlo

Visão geral

Nova abordagem

Principais técnicas

Resultados

Opinião do GN⁺

Leituras relacionadas

1 comentários

Comentário do Hacker News