我或许愿意为此据理力争,或许不愿意,而且这观点可能也算不上什么惊世骇俗的见解,但是…… 1. 很多时候,代理应该仅仅用作工作流的发现机制。真正的 ASI 是一个完美的任何任务的工作流生成器。 2. 就像我的智能体或我的大脑一旦为我的任务找到一个合适的流程(例如,一系列大致有效的步骤),我几乎总是希望直接使用这个流程,并加入一些智能体特性来处理歧义(例如,节点可能是一个智能体)。因为这样可以提高可靠性,我喜欢这样,你可能也喜欢。 3. 绝大多数问题都可以用工作流程来描述,但智能体的用户体验要好得多。我只需用自然语言提示工作流程,例如“先做这个,再做那个,然后检查这个,再回到那个……” 4. 很多提升代理性能/可靠性的方法,本质上就是对代理进行“工作流化”,强制它们执行特定步骤,并检查它们是否按顺序执行。你也可以把这称为“运用你的经验/知识”来解决问题。 归根结底,大量有用的经济工作并非开放式问题,而是需要“大致”遵循一些步骤,因此我们应该这样建模。智能体是处理真正开放式问题的最佳方法,但即便如此,如果您对问题有一些先验知识,也应该将其融入工作流程中。 “等等,你除了喋喋不休地谈论经纪人之外什么都不会?”🤬 你说得对……智能助手是执行小型、范围明确的任务的绝佳“桥梁节点”。我想我们都同意,智能助手在处理定义明确的小型任务方面表现出色,而且在处理中等规模的任务时也越来越好,无需人工干预。我本人每天都在发送 Opus4.5,因为智能助手的用户体验非常好,这一点很重要,我并不是在批评它,只是在陈述它在大多数情况下都行之有效。 经纪人也很擅长帮助你探索工作流程,有时候你甚至不知道哪些方法真正有效,那就让他们去尝试,然后神奇的事情发生了……他们会存储这些数据,进行分析,找出哪些方法有效,并将其发展成更完善的工作流程。 好了,吐槽完毕。这主要是我对代理可靠性如何体现工作流化以及这对我们所有构建代理的人来说意味着什么的一些观察。
我之前在这里写过关于这个话题的文章,我仍然不太确定这种思考方式是否完全正确,但我觉得它更接近正确答案。 https://t.co/FGBWhXiJUz