J'en ai déjà parlé il y a quelque temps. C'est évident depuis un moment, à moopen.substack.com/pub/doxa/p/why…e1Fewlx6
Une personne perspicace m'a fait une excellente analogie que je lui ai avoué vouloir reprendre, la voici : l'apprentissage par renforcement d'un modèle pour une tâche spécifique (évaluable) est comparable à la découverte d'un composé chimique ayant un effet thérapeutique précis. Son efficacité pour d'autres tâches, même sans lien apparent, n'est pas garantie ; seule l'expérimentation permet de découvrir ses autres applications (et ses éventuels effets secondaires).