Il s'agit probablement d'un problème d'inférence pour Kimi. Cependant, je constate que DeepSeek a considérablement amélioré son architecture post-entraînement au cours de l'année écoulée. La version 3.2 ne présente aucune dégradation par rapport à la version 3.1 et surpasse largement les deux R1. Meilleur modèle open source de ce test.
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.
