Des écureuils aux humains : pourquoi la compréhension de l’apprentissage animal est-elle essentielle à l’IA ? Richard Sutton, le père de l'apprentissage par renforcement, estime que : Si nous parvenons à comprendre véritablement comment les écureuils apprennent, nous serons à un pas de comprendre l'intelligence humaine. L'essence de ce point de vue est très simple : les humains sont avant tout des animaux. Sutton pensait que la capacité linguistique n'était qu'un « petit ornement à la surface ». On pourrait objecter que les humains ont marché sur la Lune et créé des semi-conducteurs ; ne s'agit-il pas là de différences fondamentales ? Sutton avait une perspective différente. Il s'intéressait aux fondements de l'intelligence, aux mécanismes sous-jacents communs aux humains et aux animaux. Que fait un écureuil tous les jours ? Trouvez des noix, évitez les prédateurs et souvenez-vous où vous cachez la nourriture. Ces comportements apparemment simples reposent sur un système d'apprentissage complexe : Il doit prédire où se trouve la nourriture, apprendre le meilleur chemin par essais et erreurs, et ajuster constamment sa stratégie en fonction des récompenses (trouver des noix) et des punitions (rencontrer un danger). C'est là l'essence même de l'apprentissage par renforcement. De plus, l'apprentissage supervisé n'existe pas dans la nature. Qu'est-ce que l'apprentissage supervisé ? En gros, il s'agit de vous donner un tas de « bonnes réponses » et de vous obliger à les suivre. Mais quand l'écureuil apprend, personne ne lui brandit un petit tableau noir en lui disant : « Cette façon de sauter est la bonne, et cette autre façon de sauter est la mauvaise. » Il a persévéré, et après quelques chutes, il a peu à peu maîtrisé l'art de sauter de branche en branche. Il en va de même pour les bébés. Si vous observez un bébé, vous constaterez qu'il essaie constamment de nouvelles choses : il agite les bras, donne des coups de pied et met des objets dans sa bouche. Personne ne leur montre la « procédure standard » ; ils explorent simplement le monde et observent les conséquences de leurs actions. Sutton estime que cette approche d'apprentissage fondée sur des objectifs et l'expérience est au cœur de l'intelligence. Les grands modèles de langage actuellement en vogue sont essentiellement des produits de l'apprentissage supervisé. Ils apprennent à partir des caractères déjà écrits par les humains, plutôt que d'explorer activement le monde comme le font les animaux. L'imitation n'est pas le fondement Voici le point de désaccord : les humains ne sont-ils pas très doués pour l’imitation ? Les enfants n’apprennent-ils pas à parler et n’acquièrent-ils pas diverses compétences en imitant les adultes ? Sutton ne nie pas l'existence de l'imitation, mais il estime que l'imitation n'en est pas le fondement, mais qu'elle repose plutôt sur un processus plus fondamental d'essais et d'erreurs. Même pour imiter, il faut d'abord apprendre « comment imiter ». Au début, les bébés ne savent même pas imiter ; ils expérimentent et tentent d'anticiper les conséquences de leurs actions. La capacité à s'imiter se développe également grâce à ce mécanisme d'apprentissage fondamental. Et l'enseignement scolaire ? Sutton pensait qu'il s'agissait d'un cas exceptionnel, propre à l'être humain, et non de la norme dans la nature. La plupart des animaux ne s'assoient jamais dans une salle de classe à écouter un cours magistral de toute leur vie, mais ils peuvent tout de même apprendre des compétences complexes de survie. La plupart des mammifères sont capables d'apprendre en continu et d'adapter leurs stratégies lorsqu'ils sont confrontés à de nouveaux environnements. Cependant, les systèmes d'IA actuels sont figés une fois entraînés, ce qui rend difficile leur apprentissage continu de nouvelles choses. À l'inverse, l'IA peut résoudre des problèmes mathématiques complexes et écrire du code, des choses que presque aucun animal ne peut faire. Qu'est-ce que cela signifie ? Cela signifie que nous nous sommes peut-être égarés. Nous poursuivons le développement de l'IA pour qu'elle fasse ce que les humains font de mieux, mais nous avons négligé les capacités fondamentales que les animaux possèdent et que l'IA ne peut pas. Selon Sutton, si nous voulons vraiment une intelligence générale, nous devons d'abord comprendre comment les animaux apprennent. Il a également proposé une perspective plus large : les humains comme les animaux sont des réplicateurs. Qu'est-ce que cela signifie ? Nous transmettons nos gènes de génération en génération par la réplication génétique. Nous sommes très intelligents, mais nous ne comprenons pas vraiment comment fonctionne notre intelligence. Pouvez-vous expliquer comment votre cerveau apprend à faire du vélo ? L'émergence de l'IA marque notre entrée dans l'ère du design. Ces agents sont conçus de telle sorte que nous sachions (théoriquement) ce que fait chaque couche de leur réseau neuronal. À l'avenir, ces IA seront capables de concevoir de nouvelles IA. Mais Sutton nous rappelle qu'avant de concevoir, nous devons d'abord comprendre l'intelligence que la nature a déjà « conçue », c'est-à-dire les mécanismes d'apprentissage des animaux. La véritable avancée ne réside peut-être pas dans la capacité de l'IA à écrire de la meilleure poésie. L'objectif est de le rendre semblable à un écureuil, capable d'explorer activement des environnements inconnus, d'apprendre en permanence et de s'adapter avec souplesse aux changements. Après tout, l'intelligence animale évolue depuis des centaines de millions d'années. Nous ne faisons que commencer. --- Résumé généré par IA, formaté manuellement.
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.