X (Twitter)

参考 [1] NNAISENSE 是一家致力于物理世界人工智能的通用人工智能公司，成立于 2014 年，其技术基于神经网络世界模型 (NWM)。J. Schmidhuber (JS) 曾任该公司总裁兼首席科学家——参见他 1990 年至 2015 年发表的 NWM 相关论文，例如 [4-5]，以及互联网档案馆中 2020 年的 NNAISENSE 网页。 https://t.co/j6xsLXHdPs （不过，最近 NNAISENSE 的业务重心已从通用人工智能 (AGI) 转向更专业化，专注于资产管理。） [2] JS，AI Blog（2022）。LeCun 2022 年关于自主机器智能的论文重述了 1990-2015 年的重要工作，但没有引用这些工作。 https://t.co/byn3K3aSxK 多年前，JS发表了LeCun所称的他“主要原创贡献”的大部分内容：例如，能够学习多个时间尺度和抽象层次、生成子目标、利用内在动机改进世界模型并进行规划的神经网络（1990年）；能够学习信息丰富的可预测表示的控制器（1997年）等等。这些内容也曾在Hacker News、Reddit和媒体上被讨论过。LeCun还列出了“2012-2022年五大最佳创意”，却只字未提其中大部分都来自JS的实验室，而且时间更早。以下是一些相关的热门推文： https://t.co/kn7KhFHLvw https://t.co/FxALILsNRu https://t.co/caTuctmztu https://t.co/Rpip8HBzPA [3] 三位图灵奖获得者如何重新发表了他们未注明出处的关键方法和思想。技术报告 IDSIA-23-23，瑞士人工智能实验室 IDSIA，2023 年。 https://t.co/Nz0fjc6kyx 建议从第 3 节开始阅读。另见[8]。相关热门推文： https://t.co/0fJVklXyOr [4] JS (1990). Making the world differentialiable: on using fully recurring self-supervised neural networks for dynamic reinforcement learning and planning in non-stationary environments. TR FKI-126-90, TUM. 该报告使用“世界模型”这一术语来描述一种循环神经网络，该网络能够学习预测环境以及独立控制器神经网络的行为后果。报告还通过生成对抗网络引入了“人工好奇心”和“内在动机”的概念，并由此引发了大量后续研究。 [4b] JS (2002). 探索可预测性。载于 Ghosh, S. Tsutsui 编，《进化计算进展》，第 579-612 页，Springer，2002 年。不要预测像素——找到复杂时空事件的可预测的内部表示/抽象！ [5] JS (2015). On Learning to Think: Algorithmic Information Theory for Novel Combinations of RL Controllers and Recurrent Neural World Models. arXiv 1210.0118. 提出了一种强化学习 (RL) 提示工程师和自适应思维链：RL 神经网络学习查询其“世界模型”网络以进行抽象推理和决策。超越了 1990 年的神经世界模型 [4]，实现了毫秒级的规划。参见十周年纪念推文：https://t.co/3FYt4x2PMM [6] JS (2018). One Big Net For Everything. arXiv 1802.08864. 将[5]中的强化学习器和世界模型（例如，基础模型）合并到一个单一网络中，使用了JS于1991年提出的神经网络蒸馏方法。参见DeepSeek推文：https://t.co/HIVU8BWAaS [7] David Ha & JS. 世界模型。NeurIPS 2018。https://t.co/RrUNYSIz6n [8] 卷积神经网络是谁发明的？技术说明 IDSIA-17-25，IDSIA，2025 年。 https://t.co/HdCanIa4MN 关于此话题的热门推文： https://t.co/6eDUT8qcNE https://t.co/chfcmk253b https://t.co/h27y6Ni2CA https://t.co/Rpip8HBzPA LinkedIn https://t.co/vzKQPhAGAy [9] Sifted.eu（2024年12月18日）。Yann LeCun将为其新的人工智能初创公司筹集5亿欧元，估值达30亿欧元。这位即将离任的Meta高管上个月宣布，他将启动一个构建“世界模型”的新项目。https://t.co/c21tW6sy3b 引述：“这家新公司将专注于‘世界模型’，即能够理解物理世界而非像当今的大型语言模型（LLM）那样仅仅生成文本的系统。”参见[1]。

来自 Jürgen Schmidhuber（@SchmidhuberAI）的推文线程

作者信息

线程正文