Nvidia刚刚在Hugging Face上发布了ChronoEdit-14B。 ChronoEdit-14B 通过时间推理实现物理感知图像编辑和动作条件化的世界模拟。它从一个 14B 参数的预训练视频生成模型中提取先验信息,并将推理过程分为两个阶段:(i) 用于潜在轨迹去噪的视频推理阶段;(ii) 用于剪枝轨迹标记的上下文编辑阶段。ChronoEdit-14B 由 NVIDIA 开发,是 ChronoEdit 多模态基础模型系列的一部分。
模型:https://t.co/Rra27kGLlu
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 3 条推文 · 2025年10月30日 17:47
Nvidia刚刚在Hugging Face上发布了ChronoEdit-14B。 ChronoEdit-14B 通过时间推理实现物理感知图像编辑和动作条件化的世界模拟。它从一个 14B 参数的预训练视频生成模型中提取先验信息,并将推理过程分为两个阶段:(i) 用于潜在轨迹去噪的视频推理阶段;(ii) 用于剪枝轨迹标记的上下文编辑阶段。ChronoEdit-14B 由 NVIDIA 开发,是 ChronoEdit 多模态基础模型系列的一部分。
模型:https://t.co/Rra27kGLlu