また (そして私は長い間このことを主張してきましたが)、ロボット工学は大規模なビデオ事前トレーニングに基づいて構築されることは明らかです。 現実世界のデータ収集のみを拡大することは、財政的にも物流的にも実現不可能である。 代わりに:ビデオ事前トレーニング -> テレオペレーションsft -> オンポリシーRL
注意: 我々はこれからまだ遠いところにいる。 (1)ロボット政策はまだ小さい (2)SORA 2/VEO 3は物理演算を学習し始めたばかりなので、必要なパフォーマンスとレイテンシを得るには1~2世代と大規模なモデル蒸留が必要です。 (3)他の容易に達成できる目標を考慮すると、まだ正当化されないのか?
