Ok, c'est vraiment génial ! EgoX : Générez des vidéos immersives à la première personne à partir de n'importe quel clip vidéo à la troisième personne Contributions : • Nous proposons un nouveau cadre, EgoX, pour synthétiser une vidéo égocentrique de haute fidélité à partir d'une seule vidéo exocentrique en exploitant efficacement des modèles de diffusion vidéo pré-entraînés. • Nous concevons une stratégie de conditionnement unifiée qui combine des informations vidéo exocentriques et des informations a priori égocentriques grâce à une intégration en largeur et en canal, permettant d'obtenir une cohérence géométrique robuste et une génération de haute qualité. • Nous introduisons une auto-attention guidée par la géométrie et des représentations latentes propres qui se concentrent sélectivement sur les régions pertinentes pour la vue et améliorent la reconstruction précise, conduisant à une synthèse égocentrique plus cohérente. • De nombreuses expériences qualitatives et quantitatives démontrent qu'EgoX surpasse largement les approches précédentes, atteignant des performances de pointe sur des benchmarks de génération vidéo exo-à-ego divers et exigeants.
Articlearxiv.org/pdf/2512.082691nu Projekeh0t0.github.io/EgoX/AgBT



