一張圖看懂DeepSeek 新模型DeepSeek-Math-V2! DeepSeek 剛剛發布了DeepSeek-Math-V2! 沒錯,這是一個專門面向數學推理領域的領域專用模型,這次是基於DeepSeek-V3.2 進行後訓練/微調的, 意味著DeepSeek 已經完全切換到新架構上了. 性能方面IMO 2025 (國際數學奧林匹克競賽) 刷到了83.3%, 達到了IMO 金牌水平. ProofBench-Basic 直接刷爆了, 得分99%, 碾壓其他所有模型. 而ProofBench-Advanced 僅次於Gemini Deep Think (這個是帶有純模型的平台, 順帶, 今年IMO 2025第一也是我國. 然後我把DeepSeek-Math-V2 這個83.3% 的得分直接平均到每個問題, 得分應該是210分(滿分252分,83.3%準確率),可以在美國(216分)和韓國(203分名)之間,即第33分名。
分數擬合到今年IMO榜單
基礎參數
benchmark







