Gaussiana profunda a partir del movimiento: Explorando modelos geométricos 3D de fundamentos para el splatting gaussiano Contribuciones: • Adaptación del modelo base sin poses: A diferencia de VGGT/MegaSAM, que se basan en poses precalculadas (potencialmente afectadas por imprecisiones), nuestro sistema funciona sin anotaciones de pose. Esto se logra refinando dinámicamente las geometrías gaussianas para alinear la apariencia fotométrica con la síntesis de nuevas vistas consistentes con los rayos. • Diseño de marco progresivo y modular: El diseño progresivo permite una escalabilidad iterativa, solucionando los cuellos de botella de la GPU presentes en las canalizaciones tipo VGGT. La modularidad garantiza la robustez ante la diversidad de escenas, permitiendo el perfeccionamiento de los componentes independientemente de las limitaciones de memoria impuestas por conjuntos de imágenes densos. • Predicción gaussiana específica de la escena: Nuestro método predice dinámicamente geometrías gaussianas para cada escena de entrada, adaptándose a sus características fotométricas y geométricas únicas para una síntesis de alta calidad; una flexibilidad menos evidente en métodos de alimentación directa como VGGT/MegaSAM, que procesan las entradas de forma menos adaptativa.
Documento (pdopenreview.net/pdf/0a5c5e8277…IDqS



