Nous avons volontairement limité le suivi post-entraînement afin de permettre une spécialisation plus poussée au sein de la communauté. À titre d'indicateur du potentiel inexploité des modèles, nous rapportons des scores de réussite de 1, 2, 4 et 8 pour les benchmarks de génération de code, d'agentic et de mathématiques. Génial ! Sortie très attendue.
Vos modèles post-entraînés doivent être « sous-cuits »…