谁还记得 Karpathy 当年手动研究 ImageNet 的情景?手动检查模型输入仍然具有巨大的优势,尤其是在如今的 LLMS/智能体时代更是如此。这有助于培养直觉,从而更好地进行智能体工程设计。如今,智能体的输入数据是大量拼凑而成的集合,包括系统提示、工具定义、工具输入/输出、思考过程、用户消息以及智能体输出。 @HamelHusain,你这话听起来像是在说“看看你的数据”。好像你真把所有数据都看完之后,还能搞清楚到底发生了什么?不过,你可以通过建立系统来更好地准备输入数据(上下文工程),从而帮助模型更好地为你服务。对故障模式的最佳直觉往往来自于直接阅读故障轨迹。 如今,智能体可以帮助你梳理运行过程中产生的大量数据。但要明白,人类在自己熟悉的领域是出色的评估者,而智能体则是海量数据中优秀的模式匹配者——这两者结合堪称完美。 我想听听那些开发代理的人觉得他们做了多少体力劳动,以及他们认为这些劳动对他们有多大帮助。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。