X (Twitter)

酷，DeepSeek剛剛上新了最新模型：DeepSeek-Math-V2，達IMO金牌級水平基於DeepSeek-V3.2-Exp-Base，685B，專注於數學推理與定理證明 Math-V2不僅是算答案，而是產生完整證明，能自己檢查自己證明對不對的數學AI 在IMO2025、CMO 2024上達到了金牌級成績，在Putnam 2024上接近滿分118/120 具體是，先訓練一個準確可信的驗證器，來判斷證明過程是否嚴謹再用此驗證器作為獎勵模型，訓練證明產生器，鼓勵其在提交前主動發現並修正證明中的問題隨著生成器變強，持續擴大驗證計算量，自動標註難以驗證的證明，反哺驗證器訓練，形成「生成-驗證」循環提升 DeepSeekMath-V2等於讓AI數學從出答案躍遷到了寫證明，不光能寫，還能自己檢查哪裡不對越寫越嚴謹 #DeepSeekMathV2

模型：huggingface.co/deepseek-ai/De… 論文：github.com/deepseek-ai/De…

模型：https://t.co/Hmz6P83CsI
論文：https://t.co/yNtXy9pA2e

來自 AIGCLINK（@aigclink）的推文串

作者資訊

推文串內容