X (Twitter)

另外（我知道我已經反覆強調這一點一段時間了），很明顯，機器人技術將建立在大規模視訊預訓練的基礎上。單靠擴大現實世界的資料收集規模，在經濟和後勤上都是不可行之舉。改為：影片預訓練 -> 遠距操作 SFT -> 基於策略的強化學習

注意：我們離這個目標還很遠。據我所知：（1）機器人政策仍然很小 (2) Sora 2/Veo 3 目前還在學習物理，所以需要 1-2 代迭代加上大量的模型提煉才能達到所需的性能和延遲。（3）鑑於還有其他唾手可得的成果，這種做法是否合理？

來自 will depue（@willdepue）的推文串