大模型終於能一口氣生成5分鐘影片了? 來自復旦, 南京大學等幾所大學的研究員發布了新的多模態可控超長視頻世界模型LongVie 2, 這個模型最大的特點是可以生成長達5分鐘的視頻. 該模型基於Wan 2.1 魔改, 實現了一個個三階段流水線, 包括多模態引導,針對輸入幀的退化感知訓練和歷史上下文引導從而達到了輸出3至5分鐘的連貫視頻.其核心是優先保證因果一致性,而非簡單的幀預測.
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 1 則推文 · 2025年12月22日 凌晨4:00
大模型終於能一口氣生成5分鐘影片了? 來自復旦, 南京大學等幾所大學的研究員發布了新的多模態可控超長視頻世界模型LongVie 2, 這個模型最大的特點是可以生成長達5分鐘的視頻. 該模型基於Wan 2.1 魔改, 實現了一個個三階段流水線, 包括多模態引導,針對輸入幀的退化感知訓練和歷史上下文引導從而達到了輸出3至5分鐘的連貫視頻.其核心是優先保證因果一致性,而非簡單的幀預測.