On voit notamment des gens énumérer 101 problèmes liés à la mise à l'échelle du RL, mais ils ne font preuve d'aucune imagination suffisante pour trouver des solutions. Il est important de rappeler que toutes ces entreprises spécialisées dans les environnements d'apprentissage par renforcement ont moins de six mois. Nous n'en sommes qu'aux prémices.
La progression, de l'édition de fichiers individuels/saisie semi-automatique l'an dernier à la même époque à environ 30 minutes de développement logiciel autonome avec Codex aujourd'hui, est tout simplement remarquable. Année après année, parier contre l'apprentissage profond reste une très mauvaise idée.