X (Twitter)

剛剛，DeepSeek 發布了最新V3.2 模型，主打高效推理與強大的Agent 能力。引入稀疏注意力（DSA）機制，在保持模型效能的同時大幅降低運算複雜度，專門對長上下文場景做了最佳化。在大規模Agent 任務合成中實現了突破，將推理能力整合進工具呼叫場景，顯著提升模型在複雜互動環境下的表現。模型位址：https://t.co/VwGFgEylOz 同時，也推出了一個增強版DeepSeek-V3.2-Speciale 表現更是亮眼。在強化學習框架加持下，推理能力號稱超越GPT-5 與Gemini-3.0-pro 相當，並在IMO 2025 和IOI 等國際競賽中獲得金牌。模型位址：https://t.co/yWt5pX9UH2 除此之外，還更新了Chat Template 以支援thinking with tools 能力，新增developer 角色專門用於搜尋代理。總的來看，DeepSeek 這次升級相當硬核，值得大家注意一下。

來自 GitHubDaily（@GitHub_Daily）的推文串

作者資訊

推文串內容