X (Twitter)

新版Gemini Deep Research 在多個研究任務基準上取得領先表現：在Humanity's Last Exam（HLE 綜合知識與推理）上取得46.4%的最先進成績在DeepSearchQA （多步驟網頁研究）表現優異，得分66.1% 在BrowseComp （瀏覽與比較任務）上表現同樣出色，得分59.2% 均為目前最先進（state-of-the-art）的成績。

Google 認為，大型語言模型正在從「單次文字生成工具」演化為「可持續執行任務的智慧系統」。而Interactions API 正是為此設計的基礎架構。 xiaohu.ai/c/xiaohu-ai/go…

Google 認為，大型語言模型正在從「單次文字生成工具」演化為「可持續執行任務的智慧系統」。

而Interactions API 正是為此設計的基礎架構。 https://t.co/JKbP7fgQnh

來自小互（@imxiaohu）的推文串

作者資訊

推文串內容