新版Gemini Deep Research 在多個研究任務基準上取得領先表現: 在Humanity's Last Exam(HLE 綜合知識與推理) 上取得46.4%的最先進成績 在DeepSearchQA (多步驟網頁研究)表現優異,得分66.1% 在BrowseComp (瀏覽與比較任務)上表現同樣出色,得分59.2% 均為目前最先進(state-of-the-art)的成績。
Google 認為,大型語言模型正在從「單次文字生成工具」演化為「可持續執行任務的智慧系統」。 而Interactions API 正是為此設計的基礎架構。 xiaohu.ai/c/xiaohu-ai/go…

