從「Tool search」 到「Skills」:AI Agent 架構的範式重構 Claude 發布了Skills 規則、Codex 也開始支援Skills,它正在成為AI Agent 標配能力。將所有工具一股腦扔給LLM 讓其自行選擇(即“Tool search”)是一條死胡同;未來的方向是將能力封裝為獨立、可靠的“Skills”,並通過更精準的分類機制來調用。 核心論點:為什麼「工具搜尋」已死? 在早期的Agent 開發中,開發者習慣將數十甚至上百個Function Calling 定義全部塞進大模型的Prompt 上下文中,指望模型能像查字典一樣,自己「搜尋」並挑選出正確的工具來使用。 作者認為這種模式有三大致命傷: · 不可靠: 當工具數量增加,模型的注意力會被分散,經常選錯工具或產生幻覺。 · 擴充性差: 上下文視窗是有限且昂貴的。試圖在一個Prompt 裡塞入所有工具的定義,不僅浪費Token,還會降低模型的推理品質。 · 缺乏「用法」知識: 僅僅給模型一個工具的API 定義(例如get_weather(city))是不夠的。模型往往需要知道「何時使用」、「怎麼用」以及「遇到錯誤怎麼辦」等隱性知識,而「工具搜尋」模式忽略了這些上下文。 解決方案:技能正在成為新的標準「技能」不僅僅是工具的重命名,它代表了一種更模組化、更具指導性的架構想法。 什麼是「技能」? · 封裝了上下文: 一個「技能」不僅包含工具本身,還包含瞭如何使用該工具的最佳實踐、特定的Prompt 指令、甚至是一些預置的知識庫。 · 按需載入: 技能不是一直掛在上下文裡的。系統只在需要的時候,才把特定的技能「載入」給模型。 它是如何運作的? (分類vs. 搜尋) 作者提倡使用分類器或路由層,而不是讓大模型在長列表中盲目搜尋。 · 意圖辨識: 當使用者發出請求時,先透過一個輕量級模型或分類器判斷意圖。 · 載入技能: 根據分類結果,系統只會調取對應的「檢索技能包」或「程式設計技能包」進入上下文。 · 精準執行: 此時,主模型看到的只有幾個與目前任務高度相關的工具和詳細的指導說明,因此成功率極高。 總結:對AI 開發者的啟示 Agent 開發正在從「提示詞工程」走向「軟體工程」。 · 舊模式: 把所有希望寄託在LLM 的泛化能力上,祈禱它能從混亂中找到對的工具。 · 新模式(技能): 像寫程式碼一樣,將複雜任務解耦。不僅給AI 錘子,還給它附上一本「錘子使用指南」,並且只在需要敲釘子的時候才把它們遞過去。 這種轉變使得AI Agent 從「偶爾能用的玩具」變成了「穩定可靠的生產力工具」。對於企業級應用程式來說,定義清晰、邊界明確的「技能」庫,將是比單純堆砌模型參數更重要的資產。 閱讀原文
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
