Donc, en termes de performances, un modèle équivalent à la version 3.2. Deux fois moins de paramètres et peut-être deux fois plus de jetons effectifs (23T@Muon). Les laboratoires de recherche les plus réputés s'attaquent de plus en plus à cette méthodologie d'apprentissage par renforcement massive. C’est sur les bases de nouvelle génération que nous verrons à nouveau des différences intéressantes.
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.