X (Twitter)

DeepSeek 開源了一個數學推理大模型：DeepSeek-Math-V2 超越Gemini 拿下IMO 金牌它不僅能給出正確答案，還能驗證自己的推理是否合理核心創新是開發了一個“生成+ 驗證+複審”的自我驗證系統” 模型能：自動產生數學證明；自行檢查每一步驟是否合理；修正推理錯誤後再輸出最終證明。 DeepSeek-Math-V2 在多個高難度數學測驗上表現優異在五大數學領域（代數、幾何、數論、組合、不等式）： DeepSeekMath-V2 全面超越GPT-5-Thinking 與Gemini 2.5 Pro。競賽表現 IMO 2025（國際數學奧賽）：解出6 題中5 題，金牌程度。 CMO 2024（中國數學奧賽）：解出4 題+ 1 題部分得分，金牌程度。 Putnam 2024（美國大學數學賽）：118/120 分，幾乎滿分。

能力特點準確率高：答案正確率超過GPT-5 與Gemini 系列；推理嚴謹：每一步邏輯都能自我檢測，避免跳步或幻象；自我改進能力強：能在多輪驗證中不斷提升證明品質；解釋性好：輸出不僅有結論，還有完整推理過程；詳細介紹：xiaohu.ai/c/a066c4/deeps…

能力特點

準確率高：答案正確率超過GPT-5 與Gemini 系列；
推理嚴謹：每一步邏輯都能自我檢測，避免跳步或幻象；
自我改進能力強：能在多輪驗證中不斷提升證明品質；
解釋性好：輸出不僅有結論，還有完整推理過程；

詳細介紹：http

GitHub：github.com/deepseek-ai/De… 模型下載：huggingface.co/deepseek-ai/De…

来自小互（@imxiaohu）的推文线程

作者信息

线程正文