25 年后,@ylecun 在 2015 年的幻灯片中重述了 1990 年关于循环神经“世界模型”的论文,该模型可以预测所有感觉输入,包括像素和多维奖励信号及疼痛信号: J. Schmidhuber. 使世界可微:关于使用全循环自监督神经网络在非平稳环境中进行动态强化学习和规划。慕尼黑工业大学技术报告 FKI-126-90,1990 年。https://t.co/VJvrmtsE6m 另请参阅概述网站,其中包含许多后续论文:1990 年 - 使用循环世界模型和人工好奇心进行规划和强化学习。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
