有趣的是:DeepSeek V3(2024年12月)的多代幣預測模型建立在EAGLE(2024年1月)的基礎上,並引用了Meta的MTP(2024年4月)作為「靈感來源」。如今,MTP已成為中國模型的標準配置。 Meta 的 LLaMA 4(2025 年 4 月)不使用 MTP(或幾乎不使用任何技術)。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 1 則推文 · 2025年10月30日 晚上11:43
有趣的是:DeepSeek V3(2024年12月)的多代幣預測模型建立在EAGLE(2024年1月)的基礎上,並引用了Meta的MTP(2024年4月)作為「靈感來源」。如今,MTP已成為中國模型的標準配置。 Meta 的 LLaMA 4(2025 年 4 月)不使用 MTP(或幾乎不使用任何技術)。