X (Twitter)

一張圖看懂DeepSeek 新模型DeepSeek-Math-V2！ DeepSeek 剛剛發布了DeepSeek-Math-V2！沒錯，這是一個專門面向數學推理領域的領域專用模型，這次是基於DeepSeek-V3.2 進行後訓練/微調的, 意味著DeepSeek 已經完全切換到新架構上了. 性能方面IMO 2025 (國際數學奧林匹克競賽) 刷到了83.3%, 達到了IMO 金牌水平. ProofBench-Basic 直接刷爆了, 得分99%, 碾壓其他所有模型. 而ProofBench-Advanced 僅次於Gemini Deep Think (這個是帶有純模型的平台, 順帶, 今年IMO 2025第一也是我國. 然後我把DeepSeek-Math-V2 這個83.3% 的得分直接平均到每個問題, 得分應該是210分（滿分252分，83.3%準確率），可以在美國（216分）和韓國（203分名）之間，即第33分名。

分數擬合到今年IMO榜單

基礎參數

benchmark

來自 karminski-牙医（@karminski3）的推文串

作者資訊

推文串內容