這種利用工程手段「塑造鋸齒狀智慧」的概念是我最喜歡的從當今系統中提取智慧的思維模型之一。 從預訓練到強化學習再到工具設計,每個階段都是塑造修格斯行為的練習。 其中,最容易實現的行為塑造是在代理/工具設計方面——諸如提示設計、上下文工程、工具設計之類的東西,都是可以放大訓練設置中某些維度的槓桿(例如:匹配訓練後看到的格式或問題表述),或者限制模型,使其在高智能的情況下運行,而其智能(例如:低上下文使用)則不然。 我們正試圖透過精心設計周圍的環境來建立一個極其智慧的成功系統,有趣的是,我們(試圖)以同樣的方式幫助人們在現實世界中取得成功。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。