歸藏(guizang.ai) (@op7418): 文心 ERNIE-5.0-Preview-1203 在 LMArena 文本领域排行居然到了国内第一。再往前基本就全是 GPT、Clau…

Wenxin ERNIE-5.0-Preview-1203 a atteint de manière surprenante la première place du classement de recherche textuelle LMARaena en Chine. Plus loin, on trouve essentiellement GPT, Claude et Gemini. Par ailleurs, leur score à cette version de LMARaena a augmenté de 23 points par rapport à la version précédente, ce qui représente une nette amélioration. Les critères d'évaluation portaient principalement sur la créativité et la complexité des consignes, deux domaines où les capacités textuelles du modèle sont actuellement les plus sollicitées. Ils ne se privent plus de leurs grandes surprises ; au contraire, ils publient fréquemment de nouvelles versions et les peaufinent constamment pour en améliorer les performances. Cette approche est judicieuse ; ils devraient communiquer davantage avec la communauté open source afin de recueillir des avis.

Fil de 歸藏(guizang.ai) (@op7418)

Informations sur l'auteur

Contenu du fil