X アカウント TestingCatalog からのリークによると、Google は Gemini Enterprise にマルチエージェントの「自動調査」モードを追加しました。(https://t.co/aBhEeNzIge) GoogleはGemini for Enterpriseにマルチエージェントシステムを構築しています。トピックと評価基準を与えるだけで、Geminiは大量のアイデアを自動生成します。そして、エージェントチームを編成し、トーナメントのようにラウンドごとにアイデアをレビューしていきます。 このシステムは一度に約40分間連続して動作できます。一般的な企業ユーザー向けの製品としては、これは非常に長時間の連続推論プロセスです。 40分間の作業終了後、ユーザーは、最初に設定した基準に基づいて、最良から最悪までランク付けされたアイデアの長いリストを受け取ります。このリストは非常に大規模で、システムは一度に約100個のアイデアを生成できます。各アイデアについて、以下の情報が得られます。 - 概要 - より詳しい説明 - レビューの要約 - 完全な長いレビュー - そして専用の「トーナメント成績レポート」。 この「パフォーマンスレポート」は独立した出力で、いつでも開いて確認できます。生成されたアイデアはすべて選択可能で、いずれかをクリックするとさらに詳しく確認できます。 現在のベータ版では、Google は 3 つのエージェントを構築したようですが、そのうち 2 つはこのマルチエージェント「トーナメント」システム上に構築されています。 最初のものは「アイデアの生成」と呼ばれます。 このモードでは、トピックを指定するだけで、エージェントが完全なマルチエージェントワークフローを開始し、「トーナメント形式の評価」を使用して様々な関連アイデアを生成し、ランク付けします。(いわゆるトーナメント形式の評価とは、ソリューションが常に互いに「競争」し、勝者が残り、弱いものは排除されることを意味します。) 2番目は「共同科学者」と呼ばれます。 こちらは科学研究開発のシナリオに特化しています。研究テーマを指定し、追加データを提供すると、インテリジェントエージェントのチームがまず研究の方向性と計画を生成し、その後、同じトーナメントメカニズムを用いてこれらのアイデアを評価します。ただし、今回は科学研究と探査のニーズに重点が置かれます。 ここで最も興味深いのは、そこに投入された信じられないほど高い計算能力です。エージェントが約40分間連続してタスクを実行できるようにすることは、現在のほとんどのエージェントツールでは「贅沢な構成」と見なされています。 40分間を通して、システムは問題を継続的に反復処理し、生成、フィルタリング、スコアリング、そして再編成を繰り返します。現在、これらすべてはGemini for Enterprise内でのみ機能しており、社内開発段階にあり、一般ユーザーからは非公開で、公式機能としてはまだ一般公開されていません。 既存のエージェント実装と比較すると、これは大きな飛躍と言えるでしょう。ブラウザのような機能を既に備えている高度なエージェントでさえ、通常はコンテキストウィンドウと時間的制約によって制限されます。 今回、Googleのアプローチは、企業顧客が利用できるよう「膨大なコンピューティングパワーを直接提供する」というものであり、正真正銘のフロントエンド製品インターフェースを構築するものです。これは「レベル3 AI」という概念と完全に一致しています。このレベルのAIエージェントは、同じ問題に相当な時間継続して取り組むことができるとされています。(ここでのレベル3は統一規格ではなく、「長時間継続して作業できるエージェント」を指す非公式な業界用語です。)この観点から見ると、エージェントが単一のタスクを40分間実行することは、非常に典型的であり、やや過激な例と言えるでしょう。 実用上、このシステムの中核となる出力は「厳選され、洗練されたアイデアの集合」です。しかし、これらは単なるランダムな提案の集合ではありません。構造化された研究の方向性を示すものとして捉えることができます。データと問題のコンテキストを考慮すれば、これらの方向性は真に価値の高い洞察につながる可能性を秘めています。そのため、Googleがこの極めて強力なエージェント機能を、特に組織、企業、そして研究チーム向けに進化させていること自体、非常に興味深いことです。 この機能が最終的に一般公開されれば、特にこれらのエージェントが最終的にGemini 3 Proを搭載するのであれば、大きな飛躍となる可能性があります。現在、Gemini 3 ProはGemini Enterpriseではまだ利用できないため、これらの実験的なエージェントがどのモデルで動作しているかは不明です。 まだテストと検証すべきことはたくさんあります。システムにプロンプトを送信すると、まず「計画されている内容」の概要が表示されます。評価対象となる次元、そしてアイデアを生成・フィルタリングする方向性です。この概要を確認して初めて、システムは実際に「大きなタスク」を開始します。これは、膨大な計算能力を消費する前に、「あなたの問題をどのように理解するつもりか」についてあなたと合意することと同じです。 マルチエージェントトーナメントワークフローに加えて、Gemini Enterpriseには「Chat with your docs」という専用のUIを持つエージェントも用意されています。このエージェントを使用すると、最大30MBのPDFファイルをアップロードし、それらのドキュメントと専用の会話を行うことができます。 この機能はGemini Enterpriseの一部ですが、まだ一般公開されておらず、実稼働環境では利用できません。設計思想は、最大30MBのPDFコンテンツを分析し、モデルのコンテキストに書き込むことで、ユーザーが手作業によるページめくりだけに頼るのではなく、既存のドキュメントからより価値のある情報を抽出できるようにするというものです。 Gemini Enterprise では他にも多くの機能が開発中ですが、最も注目を集めているのは次の 2 つの機能です。 1. マルチエージェントトーナメントスタイルのワークフロー 2. ドキュメント指向の専門インテリジェントエージェント 特に、トーナメントベースのマルチエージェントアーキテクチャは画期的な製品アプローチと言えるでしょう。他の大規模言語モデル(LLM)サービスプロバイダーは、このレベルで同様のものを提供していないようです。エンドユーザー向けツールにおいて、マルチエージェントトーナメントは依然として非常に稀です。Grok Heavyを比較対象として検討することは可能かもしれませんが、Googleのアプローチと完全に同じ方向性を持つとは考えにくいでしょう。 これらのエージェントが成熟すれば、正式な評価システムとベンチマークテストが実施されることが非常に重要になるでしょう。現状の説明に基づくだけでも、Co-scientistエージェントは既に多くの大規模組織や研究チーム、特に新たな科学的方向性を模索しているチームを刺激するのに十分です。 これらのインテリジェント エージェントがいつ正式にリリースされるのか、また企業以外のユーザーにも利用可能になるかどうかについては、現時点ではすべて不明です。 ソース:
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。