25年後、@ylecun の 2015 年のスライドは、ピクセルや多次元の報酬信号、痛みの信号を含むすべての感覚入力を予測するリカレント ニューラル「世界モデル」に関する 1990 年の論文を焼き直しました。 J. シュミットフーバー. 世界を微分化可能にする:非定常環境における動的強化学習とプランニングのための完全再帰型自己教師付きニューラルネットワークの活用について。技術報告書 FKI-126-90、TUM、1990年。https://t.co/VJvrmtsE6m 多数のフォローアップ論文が掲載されている概要 Web サイトも参照してください: 1990 - Planning & Reinforcement Learning with Recurrent World Models and Artificial Curiosity。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
