我或許願意為此據理力爭,或許不願意,而且這觀點可能也算不上什麼驚世駭俗的見解,但是…… 1. 很多時候,代理應該只用作工作流程的發現機制。真正的 ASI 是一個完美的任何任務的工作流程產生器。 2. 就像我的智能體或我的大腦一旦為我的任務找到一個合適的流程(例如,一系列大致有效的步驟),我幾乎總是希望直接使用這個流程,並加入一些智能體特性來處理歧義(例如,節點可能是一個智能體)。因為這樣可以提高可靠性,我喜歡這樣,你可能也喜歡。 3. 絕大多數問題都可以用工作流程來描述,但智能體的使用者體驗要好得多。我只需用自然語言提示工作流程,例如“先做這個,再做那個,然後檢查這個,然後再回到那個……” 4. 很多提升代理性能/可靠性的方法,本質上就是對代理進行“工作流化”,強制它們執行特定步驟,並檢查它們是否按順序執行。你也可以把這稱為「運用你的經驗/知識」來解決問題。 歸根結底,大量有用的經濟工作並非開放式問題,而是需要「大致」遵循一些步驟,因此我們應該這樣建模。智能體是處理真正開放式問題的最佳方法,但即便如此,如果您對問題有一些先驗知識,也應該將其融入工作流程中。 「等等,你除了喋喋不休地談論經紀人之外什麼都不會?」🤬 你說得對…智慧助理是執行小型、範圍明確的任務的絕佳「橋樑節點」。我想我們都同意,智慧助理在處理定義明確的小型任務方面表現出色,而且在處理中等規模的任務時也越來越好,無需人工幹預。我自己每天都在發送 Opus4.5,因為智慧助理的使用者體驗非常好,這一點很重要,我並不是在批評它,只是在陳述它在大多數情況下都行之有效。 經紀人也很擅長幫助你探索工作流程,有時你甚至不知道哪些方法真正有效,那就讓他們去嘗試,然後神奇的事情發生了……他們會儲存這些數據,進行分析,找出哪些方法有效,並將其發展成更完善的工作流程。 好了,吐槽完畢。這主要是我對代理可靠性如何體現工作流程化以及這對我們所有建立代理的人來說意味著什麼的一些觀察。
我之前在這裡寫過關於這個主題的文章,我仍然不太確定這種思考方式是否完全正確,但我覺得它更接近正確答案。 https://t.co/FGBWhXiJUz