X (Twitter)

透過開放式問題建構智能體駕馭心智模型簡而言之： - 代理的簡化視圖，它是一個具有特定任務框架和模型選擇的系統 - 線束內的模型不可互換。它們的智慧特性不穩定，因此「升級」到新模型需要更多的工作。我們所謂的“通用”代理/工具實際上是“我願意花在定制上的時間”和任務性能之間的一種權衡。 - 線束工程中一個令人興奮的領域是自主優化（元提示、模板化、dspy 等）。先決條件：我們來考慮一個智能體“有用的工作單元”，並將其稱為任務。問題：問題 1：是否存在「通用」的代理框架？我指的是那種能夠幫助解決足夠廣泛的任務，而無需進行大量額外工程開發的框架。可以想像一下「我們直接使用 Claude Code 的基礎框架」這種框架。問題 2：什麼是「存在」？例如，如果我沒有針對我的任務對工具進行超優化，我會損失多少效能？問題 3：一個「即時產生任務框架」的世界會是什麼樣子？我們希望解決「我想要極佳的任務表現」和「我希望花合理的時間來優化我的任務框架」這兩個問題。隨想：這和什麼類似？工具框架不等於提示，但其理念與 @DSPyOSS（Miprov2、GEPA 等）類似。我們希望針對我們的任務（提示、工具設計、子代理定義、有用上下文）同時且理想情況下自主地優化工具框架的各個組件。模型不可互換：模型不應該與其框架分離，它們是相互依賴的！我們真正關心的是任務效能，所以我們需要為該任務設計一個模型+框架組合。例如：如果你在做軟體工程，你其實並不關心OCR的提示、工具和模型基準測試。我們今天要做的事情：實際公司中的任務通常具有相似的「模式」：類似的輸入、類似的預期輸出、類似的中間步驟。因此，我們要么將該任務轉化為工作流程，要么編寫一個非常具體的工具和代理來完成該任務。夢想：但現實世界中真實使用者的需求變化極大。因此，理想的情況是，當任務到來時，能夠立即產生一個代理，配備針對該任務的超特定工具、指令、成功標準和智慧分析。目前，要做到這一點可能還需要人工幹預，但我們可能會看到越來越多的代理人能夠引導其他代理使用。這正是「代理構建器」公司應該投入所有資源的方向，最終的贏家將在這方面做到極致。其中一些內容或許更適合寫在部落格裡，但還是有必要分享出來。現在安全帶很流行，大家都在努力讓它們易於製造，並且…對各自的領域都非常有用。

來自 Viv（@Vtrivedy10）的推文串

作者資訊

推文串內容