重建、图像修复、测试时微调:基于单目视频的动态新视角合成 TL;DR: CogNVS 是一种用于动态新视角合成的视频扩散模型,它仅使用 2D 视频以自监督的方式进行训练! 我们将新颖视角合成重新表述为结构化的图像修复任务: 1. 使用现成的 SLAM 系统重建输入视图。 2. 创建自监督训练对,用于预训练图像修复模型。 3. 在推理时对输入进行测试时微调。
论文(pdf):httpsopenreview.net/pdf/51d7011247…:https://tcog-nvs.github.io://t.co/FD3FjbaVe7



