DeepSeek 已經將 V3 版本推向了遠超 2025 年的水平。他們在推理、工具調用、定理證明等方面都取得了進步,甚至重新調整了演算法的注意力機制。但進一步微調的收益已經遞減。 我希望他們已經完成了 32K 叢集的構建,並且能夠在 12 月發布 V4 版本。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 1 則推文 · 2025年11月27日 晚上9:33
DeepSeek 已經將 V3 版本推向了遠超 2025 年的水平。他們在推理、工具調用、定理證明等方面都取得了進步,甚至重新調整了演算法的注意力機制。但進一步微調的收益已經遞減。 我希望他們已經完成了 32K 叢集的構建,並且能夠在 12 月發布 V4 版本。