Nvidia剛剛在Hugging Face上發布了ChronoEdit-14B。 ChronoEdit-14B 透過時間推理實現物理感知影像編輯和動作條件化的世界模擬。它從一個 14B 參數的預訓練視訊生成模型中提取先驗訊息,並將推理過程分為兩個階段:(i) 用於潛在軌跡去噪的視訊推理階段;(ii) 用於剪枝軌跡標記的上下文編輯階段。 ChronoEdit-14B 由 NVIDIA 開發,是 ChronoEdit 多模態基礎模型系列的一部分。
模型:https://t.co/Rra27kGLlu
