另外(我知道我已經反覆強調這一點一段時間了),很明顯,機器人技術將建立在大規模視訊預訓練的基礎上。 單靠擴大現實世界的資料收集規模,在經濟和後勤上都是不可行之舉。 改為:影片預訓練 -> 遠距操作 SFT -> 基於策略的強化學習
注意:我們離這個目標還很遠。據我所知: (1)機器人政策仍然很小 (2) Sora 2/Veo 3 目前還在學習物理,所以需要 1-2 代迭代加上大量的模型提煉才能達到所需的性能和延遲。 (3)鑑於還有其他唾手可得的成果,這種做法是否合理?
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 2 則推文 · 2025年12月3日 下午6:42
另外(我知道我已經反覆強調這一點一段時間了),很明顯,機器人技術將建立在大規模視訊預訓練的基礎上。 單靠擴大現實世界的資料收集規模,在經濟和後勤上都是不可行之舉。 改為:影片預訓練 -> 遠距操作 SFT -> 基於策略的強化學習
注意:我們離這個目標還很遠。據我所知: (1)機器人政策仍然很小 (2) Sora 2/Veo 3 目前還在學習物理,所以需要 1-2 代迭代加上大量的模型提煉才能達到所需的性能和延遲。 (3)鑑於還有其他唾手可得的成果,這種做法是否合理?