¡La NVIDIA Nemotron 3 Nano 30B A3B filtrada, que mencionamos ayer, se lanzó oficialmente hoy! Este es un modelo de MoE que combina Mamba-2 y Transformer, con inferencia habilitada o deshabilitada. La fecha límite para obtener información es el 28 de noviembre de 2025. El logro más impresionante es la puntuación de 89,1 en la prueba de matemáticas AIME 25. Si este modelo utilizara herramientas, podría alcanzar 99,2 (algunos problemas de AIME 25 son más fáciles de resolver con métodos de programación). La puntuación de la prueba de programación LiveCodeBench (v6) es de 68,3, lo cual se considera aceptable. La puntuación de la prueba de razonamiento científico GPQA es de 73. En comparación, el Qwen3-30B-A3B-Thinking-2507 obtiene una puntuación de 85 en AIME25, 66 en LiveCodeBench (v6) y 73,4 en GPQA. En esencia, el Nemotron-3-Nano-30B-A3B es un modelo optimizado para la capacidad matemática. Sin embargo, la mayor ventaja de Nemotron-3-Nano-30B-A3B es que hace que los conjuntos de datos previos y posteriores al entrenamiento sean de código abierto, lo que lo convierte en una buena opción para el aprendizaje y la investigación. Dirección del modelo:
Parámetros de rendimiento / 1
Parámetros de rendimiento / 2







