Deepmind 發布Gemini Deep Research Agent:主要針對開發者,解決複雜的深度研究任務 核心定位:自主嚴謹的研究專家 Gemini Deep Research Agent 不僅僅是一個簡單的搜尋工具,它更像是一個能夠獨立思考的研究員。 · 自主規劃:它不會盲目搜索,而是先制定計劃,執行搜索,閱讀結果,發現資訊缺口,然後再次針對性搜索。 · 深度整合:它能同時處理海量上下文,將您上傳的私有文件與網路上的公開資訊結合進行綜合分析。 · 基於Gemini 3 Pro:核心採用Gemini 3 Pro 模型,並經過多步驟強化學習專門訓練,核心目標是提高準確性並大幅降低幻覺。 · 可驗證性:產生的報告會提供詳細的引用來源,確保每一條主張都有據可查。 硬派實力:三項基準測試SOTA 為了證明其能力,DeepMind 甚至專門開源了一個新的測試集。該Agent 在三項高難度測試中均取得了頂尖成績: · DeepSearchQA:Google 新開源的基準測試,包含900 個複雜的「因果鏈」任務。與傳統事實問答不同,它評估的是研究的「全面性」和多步驟推理能力。 Deep Research 在此取得66.1% 的高分。 · Humanity's Last Exam:在涵蓋高難度推理與知識的測驗集中,取得46.4% 的成績,達到目前業界最佳水準。 · BrowseComp:在定位「難以尋找資訊」的這項任務上,取得了59.2% 的內部最高分。 開發者利器:Interactions API 首個基於全新Interactions API 發布的Agent。 · 單一介面:開發者可以透過一個統一的端點將這種複雜的「智慧體工作流程」整合到自己的應用中。 · 高度可控:開發者可以透過Prompt 定義報表的結構、要求產生資料表格,甚至輸出JSON 格式以便下游程式處理。 · 立即透過@GoogleAIStudio 使用:開發者現在就可以使用Gemini API Key 開始建置。 產業應用情境· 金融投資:用於盡職調查,快速聚合市場訊號、競品分析和合規風險,將數天的研究工作縮短至數小時。 · 生技:幫助科學研究人員在大量生物醫學文獻中挖掘數據,預測藥物毒性,加速藥物發現流程。 Deepmind 官方介紹
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
