REFERENCIAS [1] NNAISENSE, la empresa de IA general para el mundo físico, fundada en 2014, basada en modelos de redes neuronales del mundo (NWM). J. Schmidhuber (JS) fue su presidente y científico jefe; véanse sus artículos en NWM entre 1990 y 2015, por ejemplo, [4-5], y la página web de NNAISENSE de 2020 en Internet Archive. (Sin embargo, últimamente NNAISENSE se ha centrado menos en la IAG y se ha especializado más, con un enfoque en la gestión de activos). [2] JS, AI Blog (2022). El artículo de LeCun de 2022 sobre inteligencia artificial autónoma retoma, pero no cita, trabajos esenciales del período 1990-2015. https://t.co/byn3K3aSxK Hace años, JS publicó la mayoría de lo que LeCun llama sus "principales contribuciones originales": redes neuronales que aprenden múltiples escalas de tiempo y niveles de abstracción, generan subobjetivos, utilizan la motivación intrínseca para mejorar los modelos del mundo y planifican (1990); controladores que aprenden representaciones informativas y predecibles (1997), etc. Esto también se debatió en Hacker News, Reddit y en los medios de comunicación. LeCun también enumeró las "5 mejores ideas 2012-2022" sin mencionar que la mayoría provienen del laboratorio de JS y son anteriores. Tweets populares sobre esto: https://t.co/kn7KhFHLvw https://t.co/FxALILsNRu https://t.co/caTuctmztu https://t.co/Rpip8HBzPA [3] Cómo tres ganadores del premio Turing republicaron métodos e ideas clave cuyos creadores no reconocieron. Informe Técnico IDSIA-23-23, Swiss AI Lab IDSIA, 2023. https://t.co/Nz0fjc6kyx Lo mejor es empezar con la Sección 3. Véase también [8]. Tweet popular sobre esto: https://t.co/0fJVklXyOr [4] JS (1990). Haciendo el mundo diferenciable: sobre el uso de redes neuronales autosupervisadas totalmente recurrentes para el aprendizaje de refuerzo dinámico y la planificación en entornos no estacionarios. TR FKI-126-90, TUM. Este informe utilizó el término «modelo de mundo» para una red neuronal recurrente que aprende a predecir el entorno y las consecuencias de las acciones de una red neuronal controladora independiente. También introdujo la «curiosidad artificial» y la «motivación intrínseca» mediante redes generativas antagónicas. Esto dio lugar a numerosas publicaciones posteriores. [4b] JS (2002). Explorando lo Predecible. En Ghosh, S. Tsutsui (eds.), Avances en Computación Evolutiva, págs. 579-612, Springer, 2002. No predigas píxeles: ¡encuentra representaciones/abstracciones internas predecibles de eventos espacio-temporales complejos! [5] JS (2015). Sobre el aprendizaje del pensamiento: Teoría de la información algorítmica para nuevas combinaciones de controladores de aprendizaje por refuerzo (RL) y modelos neuronales recurrentes del mundo. ArXiv 1210.0118. Introducción a un ingeniero de indicaciones de aprendizaje por refuerzo (RL) y una cadena de pensamiento adaptativa: una red neuronal de RL aprende a consultar su red de "modelo de mundo" para razonamiento abstracto y toma de decisiones. Superando el modelo neuronal del mundo de 1990 [4] para la planificación milisegundo a milisegundo. Véase el tuit del décimo aniversario: https://t.co/3FYt4x2PMM [6] JS (2018). Una Gran Red para Todo. arXiv 1802.08864. Colapsando el modelo de aprendizaje por refuerzo y el modelo de mundo de [5] (p. ej., un modelo de base) en una sola red, utilizando el procedimiento de destilación de redes neuronales de JS de 1991. Véase el tuit de DeepSeek: https://t.co/HIVU8BWAaS [7] David Ha y JS. Modelos mundiales. NeurIPS 2018. https://t.co/RrUNYSIz6n [8] ¿Quién inventó las redes neuronales convolucionales? Nota técnica IDSIA-17-25, IDSIA, 2025. https://t.co/HdCanIa4MN Tweets populares sobre esto: https://t.co/6eDUT8qcNE https://t.co/chfcmk253b https://t.co/h27y6Ni2CA https://t.co/Rpip8HBzPA LinkedIn https://t.co/vzKQPhAGAy [9] Sifted.eu (18 de diciembre de 2024). Yann LeCun recauda 500 millones de euros con una valoración de 3000 millones de euros para una nueva startup de IA. El ejecutivo saliente de Meta anunció el mes pasado el lanzamiento de un nuevo proyecto para crear "modelos del mundo". https://t.co/c21tW6sy3b Cita: «La nueva empresa se centrará en "modelos del mundo", sistemas que pueden comprender el mundo físico en lugar de simplemente generar texto como los actuales modelos de lenguaje extenso (LLM)». Véase [1].
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.