X (Twitter)

Deepmind は、主に開発者を対象とし、複雑なディープリサーチタスクを解決するために設計された Gemini Deep Research Agent をリリースしました。コアポジショニング：独立した厳格な研究専門家 Gemini Deep Research Agent は単なる検索ツールではありません。独立した思考ができる研究者のようなものです。 • 自律的な計画: 盲目的に検索するのではなく、最初に計画を立て、検索を実行し、結果を読み取り、情報のギャップを見つけ、ターゲットを絞って再度検索します。 • 緊密な統合: アップロードされたプライベートドキュメントとインターネット上で公開されている情報を組み合わせて、大量のコンテキストを同時に処理し、包括的な分析を行うことができます。 • Gemini 3 Pro ベース：カーネルは Gemini 3 Pro モデルを使用し、複数段階の強化学習によって特別にトレーニングされています。主な目標は、精度の向上と幻覚の大幅な低減です。 • 検証可能性: 生成されたレポートには詳細な引用元が提供され、すべての主張が検証可能であることが保証されます。コアの強さ：3つのベンチマークテストで最先端（SOTA） DeepMindはその能力を実証するために、新たなテストスイートをオープンソース化しました。このエージェントは、3つの非常に難しいテストで最高得点を達成しました。 DeepSearchQA：Googleが新たにオープンソース化したベンチマークテスト。900項目もの複雑な「因果連鎖」タスクが含まれています。従来の事実調査の質問とは異なり、調査の「包括性」と多段階的な推論能力を評価します。Deep Researchはこのテストで66.1%という高得点を獲得しました。人類最後の試験: 難しい推論と知識を網羅したテストセットで 46.4% のスコアを達成し、現在までに業界最高レベルに達しました。 BrowseComp は、「見つけにくい情報」を見つけるタスクで 59.2% という最高の内部スコアを達成しました。開発者の強力なツール: Interactions API 新しい Interactions API に基づいてリリースされた最初のエージェント。 • 単一のインターフェース: 開発者は、統合されたエンドポイントを通じて、この複雑な「エージェントワークフロー」をアプリケーションに統合できます。 • 高度な制御性: 開発者は Prompt を使用してレポート構造を定義し、データテーブルの生成を要求し、下流のプログラムで処理できるように JSON 形式を出力することもできます。 • @GoogleAIStudio 経由で今すぐ使用: 開発者は今すぐ Gemini API キーを使用して構築を開始できます。業界アプリケーションシナリオ: 金融投資: デューデリジェンス、市場シグナルの迅速な集約、競合他社の分析、コンプライアンスリスクに使用され、調査作業を数日から数時間に短縮します。 • バイオテクノロジー: 研究者が膨大な量の生物医学文献からデータを抽出し、薬物の毒性を予測し、薬物発見プロセスを加速できるよう支援します。 Deepmind公式紹介

meng shao（@shao__meng）のスレッド

作者情報

スレッド内容