Nouvelle vidéo publiée – Petit modèle, haut débit ! Tests en conditions réelles du modèle open-source Nemotron 3 Nano de NVIDIA. Dans cette vidéo, je vous présenterai rapidement le rapport technique et vous ferai une démonstration de quelques tests pratiques. Dans la vidéo, vous verrez : - Configuration de base du Nemotron 3 Nano : échelle des paramètres, architecture MoE + transformateur Mamba, contexte 1M - 25T de données de pré-entraînement, processus d'apprentissage en deux étapes : SFT, RLVR et RLHF - Approche officielle de quantification : De BF16 à FP8, comment maximiser la préservation du score grâce à une quantification sélective. - Nano VS Qwen3 Prochaine tâche concrète : programmation et écriture
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.
