不思議なことに、そうではありません。Deep Think はツールモードの pass@1 です。 私は、Gemini 3 Pro-Heavy は、Kimi-Thinking => Kimi Heavy よりも向上すると予測しています (より強力な基盤、マルチエージェントに関する Google の専門知識がより豊富、一方で、解読されていない質問はより難しい/間違っている + マルチモーダル)。≈53%。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。

