X (Twitter)

La clé d'un apprentissage efficace ne réside pas dans la vérifiabilité du résultat final, mais dans l'obtention d'un retour d'information à chaque étape. Par exemple, lorsque vous conduisez, vous observez constamment l'écart entre vos prédictions et la réalité. Dans des domaines comme les jeux, la programmation et les mathématiques, vos actions ont des résultats déterministes et un tel apprentissage n'a pas lieu (ni besoin). L'apprentissage par renforcement est alors sujet au surapprentissage.

Fil de Pedro Domingos (@pmddomingos)

Informations sur l'auteur

Contenu du fil