Diff4Splat: Generación de escenas 4D controlable con modelos de reconstrucción dinámica latente Contribuciones: • Proponemos DIFF4SPLAT, un modelo unificado basado en difusión que genera directamente gaussianas 3D deformables para la síntesis controlable de escenas 4D. • Construimos un conjunto de datos 4D a gran escala a partir de vídeos sintéticos y reales, anotados con información sobre apariencia, geometría a escala métrica y movimiento. • Numerosos experimentos demuestran que DIFF4SPLAT produce escenas 4D de alta fidelidad a partir de una sola imagen, superando a los sistemas de procesamiento de dos etapas y a los métodos de generación de vídeo controlados por cámara existentes tanto en calidad como en eficiencia.
Artícularxiv.org/abs/2511.0050336m Proyepaulpanwang.github.io/Diff4Splat/FPKCy



