Un empleado de NVIDIA subió accidentalmente la carpeta completa con todos los modelos a HuggingFace al cargar el archivo Nemotron-nano-3-30B-A3B, que estaba destinado a ser de código abierto. Esto incluía: EuroLLM-9B (un modelo de ponderación abierto desarrollado conjuntamente por varias universidades europeas con financiación de la UE; solo debe descargarse para estudio o referencia) NVIDIA-Nemotron-3-Nano-30B-A3B-BF16-new-chat-template (Plantilla de chat para Nemotron-3-Nano) NVIDIA-Nemotron-Nano-12B-v2 (el modelo que NVIDIA publicó en código abierto en agosto) NVIDIA-Nemotron-Nano-31B-A3-v3 (una compilación interna, no publicada anteriormente) NVIDIA-Nemotron-Nano-9B-v2-BF16 (el modelo que NVIDIA publicó en código abierto en agosto) NVIDIA-Nemotron-Nano-9B-V2-EA (¿Acceso anticipado?) NVIDIA-Nemotron-Nano-9B-v2-NGC (¿versión en la nube de NVIDIA GPU?) NVIDIA-Nemotron-Nano-9B-v2-rc0807-safetensors (¿Candidato a versión final?) NVIDIA-Nemotron-Nano-9B-v2-rc0807 (¿Candidato a lanzamiento?) NVIDIA-Nemotron-Nano-9B-v2.bak (¿Copia de seguridad?) NVIDIA-Nemotron-Nano-9B-v2 (el modelo que NVIDIA publicó en código abierto en agosto) Nemotron-H-4B-Base-8K (un modelo de código abierto creado por NVIDIA el año pasado) Nemotron-H-4B-Instruct-128K (un modelo de código abierto creado por NVIDIA el año pasado) Nemotron-H-8B-Base-8K (un modelo de código abierto creado por NVIDIA el año pasado) Nemotron-Nano-3-30B-A3.5B-dev-1016 (versión interna, no publicada previamente) Nvidia-Nemotron-Nano-v2-9B-0805 (una compilación interna, no publicada anteriormente) Qwen3-14B (Qianwen jajaja, ¿probablemente también para fines de investigación?) Qwen3-8B (千问) llama-3.1-nemoguard-8b-content-safety (un modelo que NVIDIA publicó en código abierto hace unos meses) nano-12b-v2-finalcheckpoint (una versión de punto de control interno que no se publicó anteriormente) Actualmente, no parece haber muchos daños; solo se filtraron puntos de control intermedios y algunas versiones internas. Además, parece que hay versiones de NVIDIA Nemotron Nano, ya sea 31B-A3B o 30B-A3.5B, que no se han publicado en código abierto. ¿Quizás el rendimiento no fue el ideal?
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.
