¡Genial! DeepSeek acaba de lanzar su último modelo: DeepSeek-Math-V2, que alcanza el nivel de medalla de oro de la OMI. Basado en DeepSeek-V3.2-Exp-Base, 685B, centrándose en el razonamiento matemático y la demostración de teoremas. Math-V2 no se trata solo de calcular respuestas; genera pruebas completas e incluso puede comprobar la validez de sus propias pruebas. Obtuvo resultados de nivel de medalla de oro en IMO 2025 y CMO 2024, y casi logró una puntuación perfecta de 118/120 en Putnam 2024. En concreto, primero se forma a un verificador preciso y fiable para determinar si el proceso de prueba es riguroso. Luego, utilizando este validador como modelo de recompensa, se entrena a un generador de pruebas para alentarlo a identificar y corregir de manera proactiva los problemas en la prueba antes de enviarla. A medida que el generador se vuelve más potente, la carga computacional para la verificación aumenta continuamente y las pruebas que son difíciles de verificar se etiquetan automáticamente, retroalimentando así el entrenamiento del verificador y formando un ciclo de "generación-verificación" para la mejora. DeepSeekMath-V2 ha revolucionado esencialmente las matemáticas de IA más allá de simplemente proporcionar respuestas; ahora puede escribir pruebas y no solo eso, también puede autoverificar errores, volviéndose cada vez más riguroso con cada iteración. #MatemáticasDeepSeekV2
Modhuggingface.co/deepseek-ai/De…83Csgithub.com/deepseek-ai/De…co/yNtXy9pA2e

