剛剛,DeepSeek 發布了最新V3.2 模型,主打高效推理與強大的Agent 能力。 引入稀疏注意力(DSA) 機制,在保持模型效能的同時大幅降低運算複雜度,專門對長上下文場景做了最佳化。 在大規模Agent 任務合成中實現了突破,將推理能力整合進工具呼叫場景,顯著提升模型在複雜互動環境下的表現。 模型位址:https://t.co/VwGFgEylOz 同時,也推出了一個增強版DeepSeek-V3.2-Speciale 表現更是亮眼。 在強化學習框架加持下,推理能力號稱超越GPT-5 與Gemini-3.0-pro 相當,並在IMO 2025 和IOI 等國際競賽中獲得金牌。 模型位址:https://t.co/yWt5pX9UH2 除此之外,還更新了Chat Template 以支援thinking with tools 能力,新增developer 角色專門用於搜尋代理。 總的來看,DeepSeek 這次升級相當硬核,值得大家注意一下。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
