Je ne comprends pas pourquoi les moteurs d'inférence du système d'exploitation rencontrent toujours ce problème sur quasiment tous les modèles, à des taux variables. Il s'agit ici de GLM 4.6, et 23 échantillons sur 10 000 présentent ce problème, via OpenRouter, donc soit vllm, soit sglang… Le problème persiste depuis deux ans maintenant, alors que pour gpt/claude, etc., je n'ai constaté ce genre de chose que 2 ou 3 fois sur plus de 500 000 réponses.
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.
