25 ans plus tard, la diapositive de @ylecun en 2015 reprenait l'article de 1990 sur un « modèle du monde » neuronal récurrent qui prédit toutes les entrées sensorielles, y compris les pixels et les signaux de récompense et de douleur multidimensionnels : J. Schmidhuber. Rendre le monde différentiable : Utilisation de réseaux de neurones auto-supervisés entièrement récurrents pour l’apprentissage par renforcement dynamique et la planification dans des environnements non stationnaires. Rapport technique FKI-126-90, TUM, 1990. https://t.co/VJvrmtsE6m Voir également le site web de présentation avec de nombreux articles de suivi : 1990 - Planning & Reinforcement Learning with Recurrent World Models and Artificial Curiosity.
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.
