Les humains seraient-ils aussi doués pour la « généralisation » s'ils apprenaient uniquement par approximation de fonctions ? Une généralisation efficace à partir d'un échantillon donné nécessite un *raisonnement* : une formulation et une vérification explicites des hypothèses pendant l'apprentissage. Vous évaluez le raisonnement inférentiel. Mais pas l'apprentissage du raisonnement ?
L'apprentissage par renforcement profond conventionnel (et l'apprentissage profond en général) repose sur l'apprentissage par la pratique. De petites améliorations locales mais constantes permettent de développer d'excellents réflexes. On se retrouve souvent bloqué dans l'apprentissage à un niveau d'abstraction inadéquat. On apprend par la réflexion et l'expérimentation dirigée, et non par la simple pratique.