從松鼠到人類:為什麼理解動物學習才是AI 的關鍵? 強化學習之父理查薩頓卻認為: 如果我們能真正理解松鼠是怎麼學習的,距離理解人類智慧就只差一步了。 這個觀點的核心很簡單:人類首先是動物。 薩頓認為語言能力只是"表面的一層小小的裝飾"。 你可能會反駁,人類登上了月球,製造了半導體,這些不是本質差異嗎? 薩頓的視角不一樣。他關注的是智慧的基石,那些人類和動物共享的底層機制。 一隻松鼠每天要做什麼? 找堅果、躲開天敵、記得藏食物的地點。 這些看似簡單的行為,背後是複雜的學習系統: 它要預測哪裡有食物,要透過試誤學會最佳路線,要在獎勵(找到堅果)和懲罰(遇到危險)中不斷調整策略。 這就是強化學習的本質。 另外,自然界中根本不存在監督學習。 什麼是監督學習? 就是給你一堆"正確答案",讓你照著學。 但松鼠學習的時候,沒有誰拿著小黑板告訴它"這樣跳是對的,那樣跳是錯的"。 它只是不斷嘗試,摔了幾次後,慢慢掌握了在樹枝間跳躍的技巧。 嬰兒也一樣。 你觀察一個嬰兒,會發現他們一直在主動嘗試:揮手臂、踢腿、把東西塞進嘴裡。 沒有人給他們示範"標準動作",他們就是在探索這個世界,觀察自己的行為會產生什麼結果。 薩頓認為,這種基於目標、透過經驗學習的方式,才是智能的核心。 而現在大火的大語言模型,本質上是監督學習的產物,它們學的是人類已經寫下的文字,而不是像動物一樣主動探索世界。 模仿不是基礎 這裡有個爭議:人類不是很會模仿嗎?小孩不就是透過模仿大人學會說話、學會各種技能的嗎? 薩頓不否認模仿的存在,但他認為模仿不是基礎,而是建立在更底層的試誤學習之上的。 即使是模仿,也需要先學會"怎麼模仿"。 嬰兒最開始連模仿都不會,他們只是在嘗試,在預測自己的行為會帶來什麼結果。 模仿能力本身,也是透過這種基礎學習機制發展出來的。 至於學校教育呢? 薩頓認為那是人類獨有的例外情況,不是自然界的常態。 大部分動物一輩子都不會坐在教室裡聽老師講課,但它們依然能學會複雜的生存技能。 大多數哺乳動物都能持續學習,遇到新環境就調整策略。 但現在的AI 系統,訓練完就固定了,很難持續學習新事物。 反過來,AI 能解奧數題,能寫程式碼,這些幾乎所有動物都做不到。 這說明什麼?說明我們可能走偏了。 我們在追求AI 做人類擅長的事,卻忽略了動物都會、AI 卻不會的基礎能力。 薩頓的觀點是,如果我們真的想要通用智能,我們應該先去搞懂動物是怎麼學習的。 他也提出了一個更宏大的視角:人類和動物都是複製人。 啥意思?我們透過基因複製,一代代傳承下來。 我們很聰明,但我們其實不太理解自己的智能是怎麼運作的。 你能解釋清楚你的大腦是怎麼學會騎腳踏車的嗎? AI 的出現,標誌著我們進入了設計時代。 這些智能體是被設計出來的,我們(理論上)知道它們每一層神經網路在做什麼。 未來,這些AI 還能設計出新的AI。 但薩頓提醒我們,在設計之前,我們得先理解自然界已經"設計"出來的智能,也就是動物的學習機制。 也許,真正的突破不在於讓AI 寫出更好的詩。 而在於讓它像松鼠一樣,能在陌生的環境中主動探索,持續學習,靈活應對變化。 畢竟,在智慧這件事上,動物已經進化了好幾億年。我們才剛開始。 --- AI總結生成,人工排版。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。