Síntesis de visión monocular nítida en menos de un segundo Contribuciones: • Arquitectura de extremo a extremo: diseñamos una nueva arquitectura de red que puede entrenarse de extremo a extremo para predecir representaciones gaussianas 3D de alta resolución. • Configuración de pérdida robusta y efectiva: elegimos cuidadosamente una serie de funciones de pérdida para priorizar la calidad de la síntesis de la vista mientras mantenemos la estabilidad del entrenamiento y suprimimos los artefactos visuales comunes. • Módulo de alineación de profundidad: presentamos un módulo simple que puede resolver eficazmente las ambigüedades de profundidad durante el entrenamiento, un desafío fundamental para los métodos de síntesis de vistas basados en regresión.
Artículgithub.com/apple/ml-sharp8lR Proyeapple.github.io/ml-sharp/bda9D github.com/apple/ml-sharpvbS9V8lR


