Diff4Splat : Génération de scènes 4D contrôlable avec des modèles de reconstruction dynamique latents Contributions : • Nous proposons DIFF4SPLAT, un modèle unifié basé sur la diffusion qui génère directement des gaussiennes 3D déformables pour une synthèse de scène 4D contrôlable. • Nous construisons un ensemble de données 4D à grande échelle à partir de vidéos synthétiques et de vidéos prises dans la nature, annotées avec l'apparence, la géométrie à l'échelle métrique et le mouvement. • De nombreuses expériences démontrent que DIFF4SPLAT produit des scènes 4D haute fidélité à partir d'une seule image, surpassant les pipelines en deux étapes et les méthodes de génération vidéo contrôlées par caméra existantes en termes de qualité et d'efficacité.
Articlearxiv.org/abs/2511.0050336m Projepaulpanwang.github.io/Diff4Splat/PKCy



