透過開放式問題建構智能體駕馭心智模型 簡而言之: - 代理的簡化視圖,它是一個具有特定任務框架和模型選擇的系統 - 線束內的模型不可互換。它們的智慧特性不穩定,因此「升級」到新模型需要更多的工作。 我們所謂的“通用”代理/工具實際上是“我願意花在定制上的時間”和任務性能之間的一種權衡。 - 線束工程中一個令人興奮的領域是自主優化(元提示、模板化、dspy 等)。 先決條件: 我們來考慮一個智能體“有用的工作單元”,並將其稱為任務。 問題: 問題 1:是否存在「通用」的代理框架?我指的是那種能夠幫助解決足夠廣泛的任務,而無需進行大量額外工程開發的框架。可以想像一下「我們直接使用 Claude Code 的基礎框架」這種框架。 問題 2:什麼是「存在」?例如,如果我沒有針對我的任務對工具進行超優化,我會損失多少效能? 問題 3:一個「即時產生任務框架」的世界會是什麼樣子?我們希望解決「我想要極佳的任務表現」和「我希望花合理的時間來優化我的任務框架」這兩個問題。 隨想: 這和什麼類似? 工具框架不等於提示,但其理念與 @DSPyOSS(Miprov2、GEPA 等)類似。我們希望針對我們的任務(提示、工具設計、子代理定義、有用上下文)同時且理想情況下自主地優化工具框架的各個組件。 模型不可互換: 模型不應該與其框架分離,它們是相互依賴的!我們真正關心的是任務效能,所以我們需要為該任務設計一個模型+框架組合。例如:如果你在做軟體工程,你其實並不關心OCR的提示、工具和模型基準測試。 我們今天要做的事情: 實際公司中的任務通常具有相似的「模式」:類似的輸入、類似的預期輸出、類似的中間步驟。因此,我們要么將該任務轉化為工作流程,要么編寫一個非常具體的工具和代理來完成該任務。 夢想: 但現實世界中真實使用者的需求變化極大。因此,理想的情況是,當任務到來時,能夠立即產生一個代理,配備針對該任務的超特定工具、指令、成功標準和智慧分析。目前,要做到這一點可能還需要人工幹預,但我們可能會看到越來越多的代理人能夠引導其他代理使用。這正是「代理構建器」公司應該投入所有資源的方向,最終的贏家將在這方面做到極致。 其中一些內容或許更適合寫在部落格裡,但還是有必要分享出來。現在安全帶很流行,大家都在努力讓它們易於製造,並且…對各自的領域都非常有用。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。