とにかくやってみよう!頑張ろう! フランス政府(このウェブサイトが実際にフランス政府のものであることは確認済みです)も主要モデルのランキングを作成し、Mistral-Medium-3.1がトップの座を獲得しました。(このモデルは知識レベルテストや多言語テストでも上位にランクインしていません。このモデルが他のモデルよりもフランス語が得意というわけではありません。) ランキングシステムでは、ユーザーの投票を採点基準として使用し、その後、Bradley-Terry 統計モデルを使用して「満足度スコア」を計算します。 ランキングリストには、「モデルの回答の事実または正確性を評価するものではなく、プラットフォーム ユーザーの主観的な好みを反映したものであり、公式の推奨や技術的なパフォーマンス評価でもありません」と明記されています。 私が言えるのは、フランス人がフランス製品を支持するのは完全に合理的だということだけです。 ランキングリストアドレス:
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
