大模型終於能一口氣生成5分鐘影片了? 來自復旦, 南京大學等幾所大學的研究員發布了新的多模態可控超長視頻世界模型LongVie 2, 這個模型最大的特點是可以生成長達5分鐘的視頻. 該模型基於Wan 2.1 魔改, 實現了一個個三階段流水線, 包括多模態引導,針對輸入幀的退化感知訓練和歷史上下文引導從而達到了輸出3至5分鐘的連貫視頻.其核心是優先保證因果一致性,而非簡單的幀預測.
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年12月22日 04:00
大模型終於能一口氣生成5分鐘影片了? 來自復旦, 南京大學等幾所大學的研究員發布了新的多模態可控超長視頻世界模型LongVie 2, 這個模型最大的特點是可以生成長達5分鐘的視頻. 該模型基於Wan 2.1 魔改, 實現了一個個三階段流水線, 包括多模態引導,針對輸入幀的退化感知訓練和歷史上下文引導從而達到了輸出3至5分鐘的連貫視頻.其核心是優先保證因果一致性,而非簡單的幀預測.