> La version spéciale DSV3.2 est bien plus performante que n'importe quel autre modèle. Sur 4/8 évaluations, V3.2-Speciale pense *moins* que Kimi-K2-Thinking. Sur 3, plus ; pour codeforces, aucun point de données Kimi. Un point de contrôle AdamW de 7 mois plus vieux, 33 % plus petit et à l'attention déficiente, explicitement lâché, écrase K2.
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.

