DeepSeek 發布DeepSeek V3.2 模型 強化Agent 能力,融入思考推理 在各項AI 推理測驗中,V3.2 的表現和GPT-5 差不多,只比Google 的Gemini-3.0-Pro 稍弱一點。 以前的AI 模型要嘛會思考、要嘛會呼叫工具,但不能同時進行。 DeepSeek V3.2 首次實現「思考+ 工具」雙模式 相較於上一代模型(V3.1),輸出更短、更有效率(回答速度更快、使用的算力更少) 為了讓模型更聰明地“思考推理”,DeepSeek 團隊創造了一種新的訓練方式: 模擬了1800 多個複雜任務環境; 建構了8.5 萬條難題指令; 每條指令都設計成「難回答但容易驗證」; 這樣可以讓AI 學會如何自己推理出答案,而不是複製已有知識。 這種訓練方式的結果是: 模型在沒有專門訓練的任務上,也能舉一反三地表現得很好。
DeepSeek V3.2 是第一個能在「思考過程中使用工具」的模型。 比如: 當它在解一個難題時,可以自己決定: “我需要上網查一下” “我需要呼叫程式碼解釋器” 「我需要畫個圖驗證一下」然後在「思考鏈」中一步步操作,直到得出最優解。 這讓它不只是“回答問題”,而是真正地“像人一樣解決問題”。
DeepSeek-也發布了一個特別版(Speciale) Speciale 版本融合了先前的數學模型DeepSeek-Math-V2; 它能自己證明數學定理、驗證邏輯推理; 成績驚人: 🥇 IMO(國際數學奧賽)金牌🥇 CMO(中國數學奧賽)金牌🥈 ICPC(全球程式設計競賽)人類選手第二名🥉 IOI(資訊學奧賽)人類選手第十名
DeepSeek-V3.2 已經在官網、App、API 全面上線。 DeepSeek-V3.2-Speciale(特別版): 只開放研究用途,支援「思考模式」對話,但不支援工具呼叫。 最大輸出可達128K Tokens(超長思考鏈)。 目前免費測試到2025年12月15日。 詳細介紹:https://t.co/BYQX0KH65y

