如果人類只是透過函數逼近來學習,他們還能像現在這樣「泛化」得這麼好嗎? 強大的樣本高效泛化需要*推理*:在學習過程中明確地提出假設並進行檢驗。 你可以提升推理能力,但不能學習推理能力嗎?
傳統的深度強化學習(以及一般的深度學習)是透過練習來學習的。微小但穩定的局部改進,最終會累積出優秀的反應能力。 這種學習方式常常陷入錯誤的抽象層次。我們學習需要反思和有指導的實驗,而不僅僅是練習。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 2 則推文 · 2025年11月28日 晚上7:42
如果人類只是透過函數逼近來學習,他們還能像現在這樣「泛化」得這麼好嗎? 強大的樣本高效泛化需要*推理*:在學習過程中明確地提出假設並進行檢驗。 你可以提升推理能力,但不能學習推理能力嗎?
傳統的深度強化學習(以及一般的深度學習)是透過練習來學習的。微小但穩定的局部改進,最終會累積出優秀的反應能力。 這種學習方式常常陷入錯誤的抽象層次。我們學習需要反思和有指導的實驗,而不僅僅是練習。