はい、これは本当にすごいですね! EgoX: あらゆる三人称視点クリップから没入感のある一人称視点ビデオを生成 貢献: • 事前学習済みのビデオ拡散モデルを効果的に活用して、単一のエキソセントリックビデオから高忠実度のエゴセントリックビデオを合成するための新しいフレームワーク、EgoXを提案します。 • 幅方向およびチャネル方向の統合を通じて外心ビデオと自己中心事前分布を組み合わせた統一された調整戦略を設計し、堅牢な幾何学的一貫性と高品質の生成を実現します。 • ビューに関連する領域に選択的に焦点を当て、正確な再構成を強化し、より一貫性のある自己中心的合成につながる、幾何学誘導自己注意とクリーン潜在表現を導入します。 • 広範囲にわたる定性的および定量的実験により、EgoX は従来のアプローチを大幅に上回り、多様で困難なエキソツーエゴ ビデオ生成ベンチマークで最先端のパフォーマンスを達成することが実証されています。
論文: httarxiv.org/pdf/2512.08269ジェクト: https://t.co/TthGwqAgBT



