誰還記得 Karpathy 當年手動研究 ImageNet 的情景?手動檢查模型輸入仍然具有巨大的優勢,尤其是在如今的 LLMS/智能體時代更是如此。這有助於培養直覺,從而更好地進行智能體工程設計。如今,智能體的輸入資料是大量拼湊而成的集合,包括系統提示、工具定義、工具輸入/輸出、思考過程、使用者訊息以及智慧體輸出。 @HamelHusain,你這話聽起來像是在說「看看你的數據」。好像你真把所有數據都看完之後,還能搞清楚到底發生了什麼事?不過,你可以透過建立系統來更好地準備輸入資料(上下文工程),從而幫助模型更好地為你服務。故障模式的最佳直覺往往來自於直接閱讀故障軌跡。 如今,智能體可以幫助你梳理運作過程中產生的大量資料。但要明白,人類在自己熟悉的領域是優秀的評估者,而智能體則是海量資料中優秀的模式匹配者──這兩者結合堪稱完美。 我想聽聽那些開發代理商的人覺得他們做了多少體力勞動,以及他們認為這些勞動對他們有多大幫助。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。