我非常喜歡以人機協作、評估驅動的迭代式線束設計。 範例工作流程: 1. 建立基礎代理框架(為簡單起見,假設僅包含提示和工具) 2. 在一組評估結果上運行你的代理,收集追蹤資料。這對任何人來說都可能是海量數據,難以解析,因此可以使用代理來輔助處理,但要合理地引導它們。 3. 「資料探勘」:使用另一個判斷代理人來挖掘這些軌跡,並明確你要尋找的內容。有趣的模式包括對軌跡進行分層以發現重複模式、計算工具呼叫失敗的統計數據等等。 4. 根據本輪資料探勘的結果,改進工具和提示。現在你已經掌握了數據,可以指導下一輪的重寫。這能清楚地顯示哪些方法有效,哪些無效。 5. 循環運轉直至達到飽和或您滿意為止。也可以選擇在不同線束和模型上並行運行此過程。 這增強了人類和智能體的優勢。智能體是卓越的模式匹配者,能夠快速處理大量資料。人類擁有直覺和專業知識,可以指導系統更新過程。評估結果為我們提供了一個衡量標準,讓我們能夠循序漸進地改進。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。