酷,DeepSeek剛剛上新了最新模型:DeepSeek-Math-V2,達IMO金牌級水平 基於DeepSeek-V3.2-Exp-Base,685B,專注於數學推理與定理證明 Math-V2不僅是算答案,而是產生完整證明,能自己檢查自己證明對不對的數學AI 在IMO2025、CMO 2024上達到了金牌級成績,在Putnam 2024上接近滿分118/120 具體是,先訓練一個準確可信的驗證器,來判斷證明過程是否嚴謹 再用此驗證器作為獎勵模型,訓練證明產生器,鼓勵其在提交前主動發現並修正證明中的問題 隨著生成器變強,持續擴大驗證計算量,自動標註難以驗證的證明,反哺驗證器訓練,形成「生成-驗證」循環提升 DeepSeekMath-V2等於讓AI數學從出答案躍遷到了寫證明,不光能寫,還能自己檢查哪裡不對越寫越嚴謹 #DeepSeekMathV2
模型:huggingface.co/deepseek-ai/De… 論文:github.com/deepseek-ai/De…

