Un employé de NVIDIA a accidentellement téléchargé l'intégralité du dossier contenant tous les modèles sur HuggingFace lors du téléchargement du Nemotron-nano-3-30B-A3B, destiné à être publié en open source. Ce dossier comprenait : EuroLLM-9B (un modèle de pondération ouvert développé conjointement par plusieurs universités européennes avec un financement de l'UE ; il ne doit être téléchargé qu'à des fins d'étude ou de référence) NVIDIA-Nemotron-3-Nano-30B-A3B-BF16-new-chat-template (Modèle de chat pour Nemotron-3-Nano) NVIDIA-Nemotron-Nano-12B-v2 (Le modèle que NVIDIA a rendu open-source en août) NVIDIA-Nemotron-Nano-31B-A3-v3 (Version interne, non publiée précédemment) NVIDIA-Nemotron-Nano-9B-v2-BF16 (Le modèle que NVIDIA a rendu open-source en août) NVIDIA-Nemotron-Nano-9B-V2-EA (Accès anticipé ?) NVIDIA-Nemotron-Nano-9B-v2-NGC (version NVIDIA GPU Cloud ?) NVIDIA-Nemotron-Nano-9B-v2-rc0807-safetensors (Version candidate ?) NVIDIA-Nemotron-Nano-9B-v2-rc0807 (Version candidate ?) NVIDIA-Nemotron-Nano-9B-v2.bak (Sauvegarde ?) NVIDIA-Nemotron-Nano-9B-v2 (Le modèle que NVIDIA a rendu open-source en août) Nemotron-H-4B-Base-8K (un modèle open-source mis à disposition par NVIDIA l'année dernière) Nemotron-H-4B-Instruct-128K (un modèle open-source mis à disposition par NVIDIA l'année dernière) Nemotron-H-8B-Base-8K (un modèle dont le code source a été rendu public par NVIDIA l'année dernière) Nemotron-Nano-3-30B-A3.5B-dev-1016 (Version interne, non publiée précédemment) Nvidia-Nemotron-Nano-v2-9B-0805 (Version interne, non publiée précédemment) Qwen3-14B (Qianwen hahaha, probablement aussi à des fins de recherche ?) Qwen3-8B (千问) llama-3.1-nemoguard-8b-content-safety (un modèle que NVIDIA a rendu open-source il y a quelques mois) nano-12b-v2-finalcheckpoint (une version de point de contrôle interne qui n'avait pas été publiée auparavant) Pour l'instant, les dégâts semblent limités ; seules des versions intermédiaires et quelques versions internes ont fuité. De plus, il semblerait que certaines versions de NVIDIA Nemotron Nano, les 31B-A3B et 30B-A3.5B, n'aient pas été publiées en open source. Leurs performances étaient-elles optimales ?
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.
