25 年後,@ylecun 在 2015 年的幻燈片中重述了 1990 年關於循環神經「世界模型」的論文,該模型可以預測所有感覺輸入,包括像素和多維獎勵信號及疼痛信號: J. Schmidhuber. 使世界可微:關於使用全循環自監督神經網路在非平穩環境中進行動態強化學習和規劃。慕尼黑工業大學技術報告 FKI-126-90,1990 年。 https://t.co/VJvrmtsE6m 另請參閱概述網站,其中包含許多後續論文:1990 年 - 使用循環世界模型和人工好奇心進行規劃和強化學習。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
