Nuevo video publicado: ¡Modelo pequeño, alto rendimiento! Pruebas reales del modelo Nemotron 3 Nano de código abierto de NVIDIA. En este video, le mostraré un vistazo rápido al informe técnico y le demostraré algunas pruebas prácticas. En el vídeo podrás ver: - Configuración del núcleo de Nemotron 3 Nano: escala de parámetros, arquitectura MoE + Mamba Transformer, contexto 1M - Datos de preentrenamiento de 25T, aprendizaje del curso en dos etapas + proceso de entrenamiento SFT + RLVR + RLHF - Enfoque oficial de cuantificación: desde BF16 hasta FP8, cómo maximizar la preservación de la puntuación a través de la cuantificación selectiva. - Nano VS Qwen3 Próxima tarea del mundo real: codificación y escritura
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.
