X (Twitter)

另外（我知道我已经反复强调这一点一段时间了），很明显，机器人技术将建立在大规模视频预训练的基础上。单靠扩大现实世界的数据收集规模，在经济和后勤方面都是不可行之举。改为：视频预训练 -> 远程操作 SFT -> 基于策略的强化学习

注意：我们离这个目标还很远。据我所知：（1）机器人政策仍然很小 (2) Sora 2/Veo 3 目前还在学习物理，所以需要 1-2 代迭代加上大量的模型提炼才能达到所需的性能和延迟。（3）鉴于还有其他唾手可得的成果，这种做法是否合理？

来自 will depue（@willdepue）的推文线程