De plus (et je sais que je le répète depuis un certain temps), il est parfaitement clair que la robotique reposera sur un pré-entraînement vidéo à grande échelle. Étendre la collecte de données réelles à la seule échelle est financièrement et logistiquement irréalisable. à la place : pré-entraînement vidéo → téléopération sft → apprentissage par renforcement basé sur la politique
Avertissement : nous en sommes encore loin. À ma connaissance : (1) Les politiques en matière de robotique sont encore très limitées. (2) Sora 2/Veo 3 commencent à peine à apprendre la physique, il vous faut donc 1 à 2 générations + une distillation importante du modèle pour obtenir les performances et la latence souhaitées. (3) pas encore justifié compte tenu d'autres opportunités faciles à saisir ?
