X (Twitter)

Deepmind 發布Gemini Deep Research Agent：主要針對開發者，解決複雜的深度研究任務核心定位：自主嚴謹的研究專家 Gemini Deep Research Agent 不僅僅是一個簡單的搜尋工具，它更像是一個能夠獨立思考的研究員。 · 自主規劃：它不會盲目搜索，而是先制定計劃，執行搜索，閱讀結果，發現資訊缺口，然後再次針對性搜索。 · 深度整合：它能同時處理海量上下文，將您上傳的私有文件與網路上的公開資訊結合進行綜合分析。 · 基於Gemini 3 Pro：核心採用Gemini 3 Pro 模型，並經過多步驟強化學習專門訓練，核心目標是提高準確性並大幅降低幻覺。 · 可驗證性：產生的報告會提供詳細的引用來源，確保每一條主張都有據可查。硬派實力：三項基準測試SOTA 為了證明其能力，DeepMind 甚至專門開源了一個新的測試集。該Agent 在三項高難度測試中均取得了頂尖成績： · DeepSearchQA：Google 新開源的基準測試，包含900 個複雜的「因果鏈」任務。與傳統事實問答不同，它評估的是研究的「全面性」和多步驟推理能力。 Deep Research 在此取得66.1% 的高分。 · Humanity's Last Exam：在涵蓋高難度推理與知識的測驗集中，取得46.4% 的成績，達到目前業界最佳水準。 · BrowseComp：在定位「難以尋找資訊」的這項任務上，取得了59.2% 的內部最高分。開發者利器：Interactions API 首個基於全新Interactions API 發布的Agent。 · 單一介面：開發者可以透過一個統一的端點將這種複雜的「智慧體工作流程」整合到自己的應用中。 · 高度可控：開發者可以透過Prompt 定義報表的結構、要求產生資料表格，甚至輸出JSON 格式以便下游程式處理。 · 立即透過@GoogleAIStudio 使用：開發者現在就可以使用Gemini API Key 開始建置。產業應用情境· 金融投資：用於盡職調查，快速聚合市場訊號、競品分析和合規風險，將數天的研究工作縮短至數小時。 · 生技：幫助科學研究人員在大量生物醫學文獻中挖掘數據，預測藥物毒性，加速藥物發現流程。 Deepmind 官方介紹

來自 meng shao（@shao__meng）的推文串

作者資訊

推文串內容