每個人都有一張自己最喜歡的《___狀況報告》投影片,這張是我的! 可觀測性 —> 評估 —> 改進 基本上: 1. 可觀測性:我們希望改進智能體…所以我們必須知道它們實際上在做什麼。記錄所有行為是一個不錯的預設設置,如果以後沒用了可以刪除,但至少你可以查看它們。 2. 評估:我們有一些需要關注的任務,應該用這些任務測試我們的智能體,並隨著獲得更多回饋而擴展它們。 3. 改進:我們擁有能夠處理海量數據並匹配模式的神奇機器,我們應該利用它們分析我們的數據,找出改進提示、技能、子代理等的方法… 我的任務(如果我選擇接受的話,而我已經接受了):將29.4%降到0%。 我過去(現在某種程度上也是)非常依賴「感覺」來編寫程式碼和改進智能體。就是直接上手用,感受一下效果,然後嘗試各種方法。 但是,利用代理分析代理軌跡來改進代理的這種模式也很好……實際上非常棒。 「看看你的數據」——@HamelHusain 「別忘了保存你的數據,這樣你就可以查看了」——我 這份報告的其他部分也包含許多有趣的信息,例如人們使用經紀人的實際目的。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。