X (Twitter)

谁还记得 Karpathy 当年手动研究 ImageNet 的情景？手动检查模型输入仍然具有巨大的优势，尤其是在如今的 LLMS/智能体时代更是如此。这有助于培养直觉，从而更好地进行智能体工程设计。如今，智能体的输入数据是大量拼凑而成的集合，包括系统提示、工具定义、工具输入/输出、思考过程、用户消息以及智能体输出。 @HamelHusain，你这话听起来像是在说“看看你的数据”。好像你真把所有数据都看完之后，还能搞清楚到底发生了什么？不过，你可以通过建立系统来更好地准备输入数据（上下文工程），从而帮助模型更好地为你服务。对故障模式的最佳直觉往往来自于直接阅读故障轨迹。如今，智能体可以帮助你梳理运行过程中产生的大量数据。但要明白，人类在自己熟悉的领域是出色的评估者，而智能体则是海量数据中优秀的模式匹配者——这两者结合堪称完美。我想听听那些开发代理的人觉得他们做了多少体力劳动，以及他们认为这些劳动对他们有多大帮助。

来自 Viv（@Vtrivedy10）的推文线程

作者信息

线程正文