Wenxin ERNIE-5.0-Preview-1203 a atteint de manière surprenante la première place du classement de recherche textuelle LMARaena en Chine. Plus loin, on trouve essentiellement GPT, Claude et Gemini. Par ailleurs, leur score à cette version de LMARaena a augmenté de 23 points par rapport à la version précédente, ce qui représente une nette amélioration. Les critères d'évaluation portaient principalement sur la créativité et la complexité des consignes, deux domaines où les capacités textuelles du modèle sont actuellement les plus sollicitées. Ils ne se privent plus de leurs grandes surprises ; au contraire, ils publient fréquemment de nouvelles versions et les peaufinent constamment pour en améliorer les performances. Cette approche est judicieuse ; ils devraient communiquer davantage avec la communauté open source afin de recueillir des avis.
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.
