來自李飛飛的推文(以下內容為原推文轉譯): AI 的下一個疆域是「空間智能」。這項技術將把“所見”變為“所思”,並將“感知”變為“行動”,並將“想像”變為“創造”。但它到底是什麼?為什麼重要?我們如何建構它?又該如何使用它? 今天,我想在下面的文章中,與大家分享我關於「建立和使用『世界模型』 (world models) 來解鎖空間智慧」的思考。 在這篇新文章中,我勾勒出了一個框架,闡述了「真正具有空間智能的世界模型」必須具備的三個核心能力。我們需要用它來建構這樣一種AI:它能以故事家的想像力去創造,以急救人員的流暢去導航,並以科學家的精度去推理空間。 「AI 從未像今天這樣令人興奮。像LLM 這樣的生成式AI 模型已經從實驗室走向了日常生活,成為數十億人的創意、生產力和溝通工具。然而,它們就像『黑暗中的文字工匠』——雖然能言善辯,卻毫無經驗;雖然知識淵博,卻『不接地氣』。空間智能將徹底改變我們創造和與機器人/虛擬敘事世界的方式——創造方式將它創造與世界科學、更多 解鎖空間智能的核心,在於「世界模型」的發展。這是一種新型的生成式AI,它必須應對與LLM 截然不同的一系列挑戰。這些模型必須能: 1) 生成遵守物理定律、空間一致的世界; 2) 處理從影像到動作的多模態輸入; 3) 預測這些世界將如何隨時間演變或互動。 空間智能的應用非常廣泛。 「創意工具短期正『在當下』湧現——World Labs 的Marble 已經將這些能力交到了創作者和敘事者手中。機器人中期代表了一個雄心勃勃的中期願景,我們正在完善『感知』與『行動』之間的閉環。而最具變革性的科學應用長期以來將需要更長時間,但它們有望對人類的繁榮產生深遠影響。」 「哲學家維根斯坦曾寫道:『我語言的極限,意味著我世界的極限。』我不是哲學家。但我知道,至少對AI 而言,世界『不只有文字』。空間智能代表著語言之外的疆域——它連接著想像、感知和行動,為機器真正改善人類生活從醫療到創意,從科學發現到日常協助開闢了可能。」
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。