Gaussiana Profunda a partir do Movimento: Explorando Modelos Geométricos 3D Fundamentais para Splatting Gaussiano Contribuições: • Adaptação do Modelo de Fundação sem Poses: Ao contrário do VGGT/MegaSAM, que dependem de poses pré-computadas (potencialmente afetadas por imprecisões), nosso pipeline opera sem anotações de pose. Isso é alcançado refinando dinamicamente as geometrias Gaussianas para alinhar a aparência fotométrica com a síntese de novas vistas consistentes com os raios. • Design de Framework Progressivo e Modular: O design progressivo permite escalabilidade iterativa, solucionando gargalos de GPU evidentes em pipelines do tipo VGGT. A modularidade garante robustez contra a diversidade de cenas, permitindo o refinamento de componentes independentemente das restrições de memória impostas por conjuntos densos de imagens. • Predição Gaussiana específica para cada cena: Nosso método prevê dinamicamente geometrias Gaussianas para cada cena de entrada, adaptando-se às suas características fotométricas e geométricas únicas para uma síntese de alta qualidade — uma flexibilidade menos evidente em métodos de propagação direta como VGGT/MegaSAM, que processam as entradas de forma menos adaptativa.
Artigo (pdf):openreview.net/pdf/0a5c5e8277…S



