哇,這真是太酷了! EgoX:從任何第三人稱鏡頭生成沉浸式第一人稱視頻 貢獻: • 我們提出了一種新穎的框架 EgoX,它透過有效利用預先訓練的視訊擴散模型,從單一以自我為中心的視訊合成高保真度的以自我為中心的視訊。 • 我們設計了一種統一的條件策略,透過寬度和通道上的整合,將以外部為中心的視訊和以自我為中心的先驗結合起來,從而實現了穩健的幾何一致性和高品質的生成。 • 我們引入幾何引導的自註意力和清晰的潛在表示,選擇性地關注與視圖相關的區域並增強精確重建,從而實現更連貫的以自我為中心的合成。 • 大量的定性和定量實驗表明,EgoX 的性能遠超以往的方法,在各種具有挑戰性的外向到自我視頻生成基準測試中取得了最先進的性能。
論文連結:htarxiv.org/pdf/2512.08269目連結:https://t.co/TthGwqAgBT



