C'est absurde. V3.2-thinking, l'un des LLM les plus performants, est inférieur à de nombreux modèles relativement faibles, voire à des versions plus anciennes comme V3.1, V3.2-exp et R1-0528. C'est peut-être l'exemple le plus flagrant d'un logiciel qui a été malmené.
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.

