Diff4Splat:基于潜在动态重建模型的可控4D场景生成 贡献: • 我们提出了 DIFF4SPLAT,这是一个统一的基于扩散的模型,可以直接生成可变形的 3D 高斯,用于可控的 4D 场景合成。 • 我们从合成视频和实际视频中构建了一个大规模的 4D 数据集,并标注了外观、度量尺度几何和运动。 • 大量实验表明,DIFF4SPLAT 可以从单张图像生成高保真度的 4D 场景,在质量和效率方面都优于两阶段流程和现有的摄像机控制视频生成方法。
论文链接:htarxiv.org/abs/2511.00503目链接:https://t.co/5WoVfFPKCy



