25 años después, la diapositiva de @ylecun de 2015 retomó el artículo de 1990 sobre un "modelo del mundo" neuronal recurrente que predice todas las entradas sensoriales, incluidos los píxeles y las señales de recompensa y dolor multidimensionales: J. Schmidhuber. Haciendo el mundo diferenciable: Sobre el uso de redes neuronales auto-supervisadas totalmente recurrentes para el aprendizaje por refuerzo dinámico y la planificación en entornos no estacionarios. Informe técnico FKI-126-90, TUM, 1990. https://t.co/VJvrmtsE6m Consulte también el sitio web de resumen con muchos artículos posteriores: 1990 - Planificación y aprendizaje por refuerzo con modelos de mundo recurrentes y curiosidad artificial.
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.
