WorldWarp : Propagation de la géométrie 3D par diffusion vidéo asynchrone Contributions : - WorldWarp : un nouveau cadre pour l’extrapolation de vues inédites à longue portée qui génère des segments vidéo par segments à l’aide d’un pipeline d’inférence autorégressive. - Diffusion spatio-temporelle (ST-Diff) : Un modèle de diffusion non causal qui exploite l'attention bidirectionnelle conditionnée par des images déformées vers l'avant comme a priori géométrique dense. - Un mécanisme de cache géométrique 3D en ligne : utilise 3DGS optimisé au moment du test [25] pour fournir des a priori déformés de haute fidélité tout en empêchant la propagation irréversible des erreurs des représentations 3D statiques. - Des performances de pointe sur des benchmarks d'extrapolation de vues exigeants, démontrant une cohérence géométrique et une qualité d'image nettement améliorées par rapport aux méthodes existantes.
Articlearxiv.org/abs/2512.19678O4m Projehyokong.github.io/worldwarp-page/umsa Cgithub.com/HyoKong/WorldW…iJoNtz : Fusion des connaissances du monde matériel 2D avec la géométrie 3D



