X (Twitter)

如果人類只是透過函數逼近來學習，他們還能像現在這樣「泛化」得這麼好嗎？強大的樣本高效泛化需要*推理*：在學習過程中明確地提出假設並進行檢驗。你可以提升推理能力，但不能學習推理能力嗎？

傳統的深度強化學習（以及一般的深度學習）是透過練習來學習的。微小但穩定的局部改進，最終會累積出優秀的反應能力。這種學習方式常常陷入錯誤的抽象層次。我們學習需要反思和有指導的實驗，而不僅僅是練習。

來自 Omar Khattab（@lateinteraction）的推文串