新しい DeepSeek モデル、DeepSeek-Math-V2 を理解するための 1 つの画像です。 DeepSeek は DeepSeek-Math-V2 をリリースしました。 そうです、これは数学的推論に特化したドメイン特化型モデルです。今回はDeepSeek-V3.2をベースに後学習・微調整が行われており、DeepSeekは完全に新しいアーキテクチャに移行したことになります。 パフォーマンス面では、IMO 2025(国際数学オリンピック)で83.3%のスコアを獲得し、IMO金メダルレベルに達しました。ProofBench-Basicを完全に上回り、99%のスコアを獲得し、他のすべてのモデルを圧倒しました。ProofBench-Advancedは、Gemini Deep Think(純粋モデルではなくエージェントベースプラットフォーム)に次ぐ2位でした。 ちなみに、私の国は今年のIMO 2025でも1位を獲得しました。DeepSeek-Math-V2のスコアを各問題で平均83.3%と計算したところ、210点(252点満点、正解率83.3%)となり、アメリカ(216点)と韓国(203点)の間、つまり3位になるはずです。
スコアは今年の IMO リーダーボードに適合されました。
基本パラメータ
ベンチマーク







