為什麼模型不能可靠到所有「等效」的提示都能達到同樣好的效果?因為梯度下降法會產生「鋸齒狀」的泛化結果。 但提示優化器的主要作用在於揭示有關環境/任務的*新*信息,而這些信息甚至在原始規範中都沒有明確提及。 這可能是因為此類資訊較為微妙、層次較低,或實際上依賴模型*。 @ChrisGPotts 將這些稱為「潛在需求」。 *請記住,自然語言本身就具有歧義性,但解決這種歧義的方式因說話者而異。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 1 則推文 · 2025年12月12日 晚上10:05
為什麼模型不能可靠到所有「等效」的提示都能達到同樣好的效果?因為梯度下降法會產生「鋸齒狀」的泛化結果。 但提示優化器的主要作用在於揭示有關環境/任務的*新*信息,而這些信息甚至在原始規範中都沒有明確提及。 這可能是因為此類資訊較為微妙、層次較低,或實際上依賴模型*。 @ChrisGPotts 將這些稱為「潛在需求」。 *請記住,自然語言本身就具有歧義性,但解決這種歧義的方式因說話者而異。