Wenxin ERNIE-5.0-Preview-1203 は、驚くべきことに、国内の LMARaena テキスト検索ランキングで 1 位を獲得しました。 さらに先は、基本的にすべて GPT、クロード、ジェミニです。 一方、LMARaena版では以前のバージョンと比べて23点も高いスコアを獲得しており、これは大きな改善と言えるでしょう。採点基準は主に創造的な文章作成と難しい指示に重点を置いており、これらは現在、モデルの文章作成能力が最も求められる分野でもあります。 彼らはもはや大きな驚きを隠そうとはせず、頻繁に新バージョンをリリースし、パフォーマンス向上のために絶えず調整を加えています。このアプローチは正しいです。オープンソースコミュニティともっとコミュニケーションを取り、フィードバックを得るべきです。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
