中国とアメリカのモデル間のギャップが今どれくらいなのかは分かりません。数年前までは、世代間のギャップは1~2歳程度だと一般的に考えられていました。 もう半年以上経ったような気がします? 例えば、最も人気のある大型モデルリストであるLMARaenaでは、昨年は国内モデルは基本的に「リストに入るくらいならいい」という段階でしたが、今年はClaudeやGPTなどのサイトと競争し始めました。 最も競争力のあるテキストランキングを見ると、Baidu ERNIE-5.0-Preview-1203 は実際に LMARaena テキストランキングのトップ 10 に入り、国産の大規模モデルの中で第 1 位にランクされました。 LMARaena さんのコメントによると、改善が見られたのは主に創造的な文章作成と複雑な指示の理解力でした。 これら2つの側面は、一般的に実際の使用シナリオに最も近いものですが、同時に最もエラーが発生しやすい側面でもあります。Baiduがどのように最適化したのかは分かりません。 実際、Baidu のエンジニアリング能力は常に強力であり、今になってようやく力を入れ始めたという印象です。 正式版は1月にリリースされると聞きました。その時試してみて、本当に良いものかどうか確認してみます。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。

