DeepSeek 開源了一個數學推理大模型:DeepSeek-Math-V2 超越Gemini 拿下IMO 金牌 它不僅能給出正確答案,還能驗證自己的推理是否合理 核心創新是開發了一個“生成+ 驗證+複審”的自我驗證系統” 模型能: 自動產生數學證明; 自行檢查每一步驟是否合理; 修正推理錯誤後再輸出最終證明。 DeepSeek-Math-V2 在多個高難度數學測驗上表現優異 在五大數學領域(代數、幾何、數論、組合、 不等式): DeepSeekMath-V2 全面超越GPT-5-Thinking 與Gemini 2.5 Pro。 競賽表現 IMO 2025(國際數學奧賽):解出6 題中5 題,金牌程度。 CMO 2024(中國數學奧賽):解出4 題+ 1 題部分得分,金牌程度。 Putnam 2024(美國大學數學賽):118/120 分,幾乎滿分。
能力特點 準確率高:答案正確率超過GPT-5 與Gemini 系列; 推理嚴謹:每一步邏輯都能自我檢測,避免跳步或幻象; 自我改進能力強:能在多輪驗證中不斷提升證明品質; 解釋性好:輸出不僅有結論,還有完整推理過程; 詳細介紹:xiaohu.ai/c/a066c4/deeps…
GitHub:github.com/deepseek-ai/De… 模型下載:huggingface.co/deepseek-ai/De…

