Gemini 3の公式リリース発表が届きました。 LMArenaは驚異の1501ポイントを獲得し、チャートのトップに躍り出ました。リリースされ、現在公開中です。スイート全体(検索、アプリ、API)は本日からご利用いただけます。 彼らは、O1 に似た Deep Think モードと、まったく新しいエージェント開発プラットフォームも立ち上げました。 今回のアップデートの主なハイライトを以下にまとめました👇 推論能力の大幅な向上 Gemini 3 Proは、世界最強のマルチモーダルモデルとなりました。LMArenaのチャートで1501点を獲得し、トップに立ちました。難解で知られる「人類最後の試験」では37.5%のスコアを獲得し、数学的能力もMathArenaの新記録を樹立しました。複雑なグラフの解釈から難解な数学問題の解法まで、その理解力の深さと洗練性は新たなレベルに達しています。 GoogleはGemini 3にO1と同様の低速思考モード「Deep Think」を採用しました。Deep Thinkは推論に多くの時間を費やし、特に複雑な分析を必要とする複雑な問題に対処します。テストデータによると、Pro版よりも大幅に優れたパフォーマンスを示していますが、現在はセキュリティテスターが最初に使用しており、Ultraユーザーはさらに数週間待つ必要があります。 エージェント開発の新時代:反重力 開発者にとって最も大きな進歩は、おそらく新しいGoogle Antigravityプラットフォームでしょう。Gemini 3はコード生成と長期計画において大幅な改善を誇り、SWEベンチスコア76.2%を達成しました。AntigravityはAIを真のパートナーへと変貌させ、計画、コード記述、さらにはエディタやターミナルへの権限付与、ブラウザの制御によるコード実行検証まで、あらゆる機能を提供します。まさにエンドツーエンドのエクスペリエンスを提供します。 記憶とマルチモダリティの融合 Gemini 3は依然として100万トークンのコンテキストウィンドウを使用しますが、より幅広い次元から情報を処理します。例えば、手書きの古いレシピの写真を送信すれば、それを電子版に整理できます。また、ピックルボールの試合の動画を送信すれば、動きを分析してトレーニングプランを作成できます。もはや単なるテキストの読み取りではなく、真に「シーンを理解する」のです。
Google は Gemini 3 のリリーススケジュールを急いでいるようだが、それに対して真剣に取り組んでいるとも言える。 まず、実装のスピードです。かつては論文を発表して自慢ばかりしていましたが、今は検索、アプリ、AI Studio、Vertex AIを含むすべてのプロダクトラインにおいて、リリースと同時にリリースすることが求められています。このような実行力こそが、Googleのあるべき姿です。 二つ目はAntigravityです。「反重力」という名前がとても興味深いですね。従来の開発の制約から脱却することを目指しているようです。エージェントはもはや単なるダイアログボックスではなく、エディターとターミナルの権限を持つ独立した存在です。これこそがAIプログラミングの未来です。 大規模モデルをめぐる争いはついに「実践」段階に入りました。モデル能力の差は縮まりつつあり、今や誰がそれらの能力をより早く製品に統合し、一般の人々が利用できるようにできるかが競争の焦点となっています。Googleの「検索+アプリ+クラウド」の組み合わせは、OpenAIにプレッシャーをかけています。
