LeCun 的新公司利用「世界模型」研究實體人工智慧 [9],與我們在 2014 年成立的公司 [1] 非常相似。他未經註明出處就重新發表了我幾十年前發表的內容 [2][3]。參見 1990-2018 年關於神經世界模型的論文 [4-7]。 [1] NNAISENSE 是一家致力於物理世界人工智慧的通用人工智慧 (AGI) 公司,成立於 2014 年,其技術基於神經網路世界模型 (NWM)。 J. Schmidhuber (JS) 曾任其總裁兼首席科學家——參見他 1990 年至 2015 年發表的 NWM 相關論文,例如 [4-5],以及互聯網檔案館 Wayback Machine 中的 2020 年 NNAISENSE 網頁(附圖)。 (然而,近年來,NNAISENSE 的業務重點已從通用人工智慧轉向更專業化,專注於資產管理。) [2] JS,AI Blog(2022)。 LeCun 2022 年關於自主機器智慧的論文重述了 1990-2015 年的重要工作,但沒有引用這些工作。 多年前,JS發表了LeCun所稱的他「主要原創貢獻」的大部分內容:例如,能夠學習多個時間尺度和抽象層次、生成子目標、利用內在動機改進世界模型並進行規劃的神經網路(1990年);能夠學習資訊豐富的可預測表示的控制器(1997年)等等。這些內容也曾在Hacker News、Reddit和媒體上被討論過。 LeCun也列出了“2012-2022年五大最佳創意”,卻隻字未提其中大部分都來自JS的實驗室,而且時間更早。以下是一些相關的熱門推文: https://t.co/kn7KhFHLvw https://t.co/FxALILsNRu https://t.co/caTuctmztu https://t.co/Rpip8HBzPA [3] 三位圖靈獎得主如何重新發表了他們未註明出處的關鍵方法和想法。技術報告 IDSIA-23-23,瑞士人工智慧實驗室 IDSIA,2023 年。 建議從第 3 節開始閱讀。另見[8]。相關熱門推文: https://t.co/0fJVklXyOr [4] JS (1990). Making the world differentialiable: on using fully recurring self-supervised neural networks for dynamic reinforcement learning and planning in non-stationary environments. TR FKI-126-90, TUM.該報告使用「世界模型」這個術語來描述一種循環神經網絡,該網絡能夠學習預測環境以及獨立控制器神經網路的行為後果。報告也透過生成對抗網絡引入了「人工好奇心」和「內在動機」的概念,並由此引發了大量後續研究。 [4b] JS (2002). 探索可預測性。載於 Ghosh, S. Tsutsui 編,《進化計算進展》,第 579-612 頁,Springer,2002 年。不要預測像素-找到複雜時空事件的可預測的內部表示/抽象! [5] JS (2015). On Learning to Think: Algorithmic Information Theory for Novel Combinations of RL Controllers and Recurrent Neural World Models. arXiv 1210.0118. 提出了一種強化學習 (RL) 提示工程師和自適應思維鏈:RL 神經網路思考網路以進行抽象網路模型。超越了 1990 年的神經世界模型 [4],實現了毫秒的規劃。請參閱十週年紀念推文:https://t.co/3FYt4x2PMM [6] JS (2018). One Big Net For Everything. arXiv 1802.08864. 將[5]中的強化學習器和世界模型(例如,基礎模型)合併到一個單一網絡中,使用了JS於1991年提出的神經網絡蒸餾方法。請參閱DeepSeek推文:https://t.co/HIVU8BWAaS [7] David Ha & JS. 世界模型。 NeurIPS 2018。 [8] 卷積神經網路是誰發明的? 技術說明 IDSIA-17-25,IDSIA,2025 年。 關於此主題的熱門推文: https://t.co/6eDUT8qcNE https://t.co/chfcmk253b https://t.co/h27y6Ni2CA https://t.co/Rpip8HBzPA [9] Sifted.eu(2024年12月18日)。 Yann LeCun 為其新的人工智慧新創公司籌集了5億歐元,估值達30億歐元。這位即將離任的Meta高層上個月宣布,他將啟動一個建構「世界模型」的新計畫。引述:“新公司將專注於‘世界模型’,即能夠理解物理世界而不是像當今的大型語言模型(LLM)那樣僅僅生成文本的系統。”參見[1]。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
![LeCun 的新公司利用「世界模型」研究實體人工智慧 [9],與我們在 2014 年成立的公司 [1] 非常相似。他未經註明出處就重新發表了我幾十年前發表的內容 [2][3]。參見 1990-2018 年關於神經世界模型的論文 [4-7]。](https://pbs.twimg.com/media/G8tEhGFWwAAXCZF.jpg)