xAI 正式發布Grok-4.1 Fast 和Agent Tools API Grok-4.1 Fast 是專為工具呼叫和智能體任務優化的前沿模型,被@xai 定位為目前API 中最佳的工具呼叫模型,主要面向真實世界企業級應用。 核心亮點· 工具呼叫與智能體能力大幅領先:透過在模擬環境中進行大規模強化學習訓練,模型接觸了數十個領域的各種工具,在複雜、多輪真實場景(如客服、金融服務)中表現出極強推理、規劃和執行能力。配合全新Agent Tools API,開發者可以輕鬆建立生產級自主智能體,支援長時程規劃、平行工具呼叫和獨立完成目標。 · 超大上下文視窗:支援2M token,在超長對話中保持穩定高效能。 · 事實性顯著提升:幻覺率較上一代Grok-4 Fast 降低一半,在FActScore 等事實性評測上已與Grok-4 持平。 · 速度與智慧平衡:提供兩種變體· grok-4-1-fast-reasoning:最大化推理能力· grok-4-1-fast-non-reasoning:追求極致回應速度 關鍵基準表現· τ²-bench Telecom(電信客服真實場景):100% 滿分,總成本僅105 美元· Berkeley Function Calling v4:72% 準確率,總成本400 美元· Research-Eval(智能體研究能力):63.9 分,遠超GPT-5(45.5)和Cla.5 4. · R20 FRAMES(框架評估):87.6 分,成本效率最高· X Browse(X 平台多跳搜尋任務):56.3 分,大幅領先GPT-5(24.2)和Claude(14.6) Agent Tools API:讓生產級智能體開發變得前所未有簡單開發者只需幾行程式碼即可連接以下全部由xAI 託管的生產級工具(無需自行管理金鑰、限速或安全沙箱): · 即時X 搜尋+ 網路網頁搜尋· 檔案智慧檢索(上傳文件後精準引用) · 安全Python 程式碼執行沙箱· 遠端MCP 工具(可對接第三方自訂工具) 定價與可用性· 輸入:0.20 美元/ M token(快取輸入僅0.05 美元) · 輸出:0.5 美元/ M token · 工具調用:5 美元/ 千次成功調用· 限時完全免費:即日起至2025 年12 月3 日,模型+ 所有智能體工具0 費用;透過OpenRouter 也可免費體驗
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
