X (Twitter)

來自李飛飛的推文（以下內容為原推文轉譯）： AI 的下一個疆域是「空間智能」。這項技術將把“所見”變為“所思”，並將“感知”變為“行動”，並將“想像”變為“創造”。但它到底是什麼？為什麼重要？我們如何建構它？又該如何使用它？今天，我想在下面的文章中，與大家分享我關於「建立和使用『世界模型』 (world models) 來解鎖空間智慧」的思考。在這篇新文章中，我勾勒出了一個框架，闡述了「真正具有空間智能的世界模型」必須具備的三個核心能力。我們需要用它來建構這樣一種AI：它能以故事家的想像力去創造，以急救人員的流暢去導航，並以科學家的精度去推理空間。「AI 從未像今天這樣令人興奮。像LLM 這樣的生成式AI 模型已經從實驗室走向了日常生活，成為數十億人的創意、生產力和溝通工具。然而，它們就像『黑暗中的文字工匠』——雖然能言善辯，卻毫無經驗；雖然知識淵博，卻『不接地氣』。空間智能將徹底改變我們創造和與機器人/虛擬敘事世界的方式——創造方式將它創造與世界科學、更多解鎖空間智能的核心，在於「世界模型」的發展。這是一種新型的生成式AI，它必須應對與LLM 截然不同的一系列挑戰。這些模型必須能： 1) 生成遵守物理定律、空間一致的世界； 2) 處理從影像到動作的多模態輸入； 3) 預測這些世界將如何隨時間演變或互動。空間智能的應用非常廣泛。「創意工具短期正『在當下』湧現——World Labs 的Marble 已經將這些能力交到了創作者和敘事者手中。機器人中期代表了一個雄心勃勃的中期願景，我們正在完善『感知』與『行動』之間的閉環。而最具變革性的科學應用長期以來將需要更長時間，但它們有望對人類的繁榮產生深遠影響。」「哲學家維根斯坦曾寫道：『我語言的極限，意味著我世界的極限。』我不是哲學家。但我知道，至少對AI 而言，世界『不只有文字』。空間智能代表著語言之外的疆域——它連接著想像、感知和行動，為機器真正改善人類生活從醫療到創意，從科學發現到日常協助開闢了可能。」

來自宝玉（@dotey）的推文串

作者資訊

推文串內容