ミディアムカップにはラージカップよりも多いんですか?Googleさん、確かですか? GoogleはGemini-3シリーズのミッドレンジ版となるGemini-3.0-Flashをリリースしました。Google独自のテストデータによると、Flash版はPro版よりも高いスコアを出すことがあるそうです。 さらに、複数のテストがあります。MMMU-Pro (モデル推論をテスト)、SWE-Bench-Verified (モデルコーディングをテスト)、Toolathlon (ツールの使用状況をテスト)、MMMLU (同点、多言語能力をテスト) はすべて Pro よりも高いスコアを獲得しています。 本当に信じられない。ちょっと待ってください。Flash版のコーディング能力診断テストを持ってきます。
公式データ/1
公式データ/2








