Une seule image pour comprendre le nouveau modèle DeepSeek, DeepSeek-Math-V2 ! DeepSeek vient de publier DeepSeek-Math-V2 ! En effet, il s'agit d'un modèle dédié au domaine, conçu spécifiquement pour le raisonnement mathématique. Cette fois-ci, il a été affiné et optimisé sur la base de DeepSeek-V3.2, ce qui signifie que DeepSeek a entièrement adopté la nouvelle architecture. En termes de performance, il a obtenu un score de 83,3 % à l'OIM 2025 (Olympiades internationales de mathématiques), atteignant ainsi le niveau de la médaille d'or. Il a largement surpassé ProofBench-Basic, avec un score de 99 %, écrasant tous les autres modèles. ProofBench-Advanced n'a été devancé que par Gemini Deep Think (une plateforme à base d'agents, et non un modèle pur). Par ailleurs, mon pays a également terminé premier aux OIM 2025 cette année. Ensuite, j'ai calculé la moyenne du score DeepSeek-Math-V2 de 83,3 % sur chaque question, ce qui devrait donner un score de 210 points (sur 252, soit une précision de 83,3 %), nous plaçant ainsi entre les États-Unis (216 points) et la Corée du Sud (203 points), c'est-à-dire à la 3e place.
Les scores ont été ajustés au classement de l'OIM de cette année.
Paramètres de base
point de référence







