一位聰明人給我舉了一個很棒的比喻,我告訴他我要藉用一下,所以就有了這個比喻:強化訓練模型來完成特定的(可評估的)任務,就像找到一種具有特定藥效的化合物。它可能對其他任務有效,甚至對那些毫不相關的任務無效——你只能透過實驗來了解它還有哪些其他用途(或任何副作用)。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 1 則推文 · 2025年12月14日 下午3:43
一位聰明人給我舉了一個很棒的比喻,我告訴他我要藉用一下,所以就有了這個比喻:強化訓練模型來完成特定的(可評估的)任務,就像找到一種具有特定藥效的化合物。它可能對其他任務有效,甚至對那些毫不相關的任務無效——你只能透過實驗來了解它還有哪些其他用途(或任何副作用)。