X (Twitter)

PaddleOCR に続いて、Wenxin もその取り組みを強化しようとしているのでしょうか? LMArenaがランキングを更新し、BaiduのWenxin Big Model 5.0プレビューがランクインしました！しかも世界2位です！テストデータは、クリエイティブライティングと長いコンテキストのテストで非常に高いスコアを示しており、想起パフォーマンスが非常に優れていることを意味します。私のスクリーンショットをよく見てください。クリエイティブライティング、指示の遵守、長いクエリはすべてGPT-5よりも高い評価を受けています。今回、百度のWenxinモデルの実際のパフォーマンスが気になります。後ほどテスト結果をお伝えします。また、再現率にもぜひ注目してみてください。このスコアから判断すると、再現率は良好で、レポート作成、文書解釈、データ整理といったテキストタスクに大きなメリットをもたらすはずです。実は既に使用可能で、LMArenaがテストポータルを提供しています。しかし、調べてみたところ、正式リリースは13日のBaidu Worldで予定されているようです。このモデルの技術レポートはまだ公開されていないため、正式発表を待つ必要があります。 #心からの言葉 #ERNIE #Baidu #大規模言語モデル #LLM

LMArenaの詳細なレビューデータ

karminski-牙医（@karminski3）のスレッド

作者情報

スレッド内容