De las ardillas a los humanos: ¿Por qué comprender el aprendizaje animal es clave para la IA? Richard Sutton, el padre del aprendizaje por refuerzo, cree que: Si podemos entender realmente cómo aprenden las ardillas, estaremos a un paso de comprender la inteligencia humana. La esencia de este punto de vista es muy simple: los humanos somos, ante todo, animales. Sutton creía que la capacidad lingüística era simplemente "una pequeña decoración en la superficie". Se podría argumentar que los humanos aterrizaron en la Luna y crearon semiconductores; ¿no son estas diferencias fundamentales? Sutton tenía una perspectiva diferente. Se centró en los pilares de la inteligencia, los mecanismos subyacentes que comparten humanos y animales. ¿Qué hace una ardilla todos los días? Encuentra nueces, evita a los depredadores y recuerda dónde escondes la comida. Estos comportamientos aparentemente simples están respaldados por un complejo sistema de aprendizaje: Necesita predecir dónde está la comida, aprender la mejor ruta a través de prueba y error, y ajustar constantemente su estrategia en función de las recompensas (encontrar nueces) y los castigos (encontrar peligro). Ésta es la esencia del aprendizaje por refuerzo. Además, el aprendizaje supervisado no existe en la naturaleza. ¿Qué es el aprendizaje supervisado? Básicamente te da un montón de "respuestas correctas" y te hace seguirlas. Pero cuando la ardilla está aprendiendo, nadie le sostiene una pequeña pizarra y le dice: "Esta forma de saltar es correcta y esa forma de saltar es incorrecta". Continuó intentándolo y, después de caerse unas cuantas veces, poco a poco dominó la habilidad de saltar entre las ramas. Lo mismo ocurre con los bebés. Si observas a un bebé, verás que está constantemente intentando cosas: mueve los brazos, patea las piernas y se lleva cosas a la boca. Nadie les muestra el "procedimiento estándar"; simplemente están explorando el mundo y observando las consecuencias de sus acciones. Sutton cree que este enfoque de aprendizaje basado en objetivos y en la experiencia es el núcleo de la inteligencia. Los modelos de lenguaje extensos, actualmente populares, son esencialmente productos del aprendizaje supervisado. Aprenden de los caracteres que los humanos ya han escrito, en lugar de explorar activamente el mundo como lo hacen los animales. La imitación no es la base He aquí el punto de discordia: ¿Acaso los humanos no somos muy buenos imitando? ¿Acaso los niños no aprenden a hablar y adquieren diversas habilidades imitando a los adultos? Sutton no niega la existencia de la imitación, pero cree que la imitación no es la base, sino que se basa en un proceso más fundamental de prueba y error. Incluso al imitar, primero hay que aprender "a imitar". Al principio, los bebés ni siquiera saben imitar; sólo prueban cosas y predicen cuáles serán las consecuencias de sus acciones. La capacidad de imitarse a sí mismo también se desarrolla a través de este mecanismo básico de aprendizaje. ¿Y en cuanto a la educación escolar? Sutton creía que se trataba de un caso excepcional, exclusivo de los humanos, y no la norma en la naturaleza. La mayoría de los animales nunca se sientan en un aula a escuchar la conferencia de un profesor en toda su vida, pero aún así pueden aprender habilidades complejas de supervivencia. La mayoría de los mamíferos son capaces de aprender continuamente y ajustar sus estrategias cuando se enfrentan a nuevos entornos. Sin embargo, los sistemas de IA actuales se vuelven obsoletos una vez entrenados, lo que dificulta que aprendan continuamente cosas nuevas. Por el contrario, la IA puede resolver problemas matemáticos avanzados y escribir código, cosas que casi ningún animal puede hacer. ¿Qué significa esto? Significa que quizás nos hemos extraviado. Buscamos que la IA haga lo que los humanos hacen bien, pero hemos pasado por alto las capacidades básicas que los animales pueden hacer pero la IA no. La opinión de Sutton es que si realmente queremos inteligencia general, primero deberíamos entender cómo aprenden los animales. También propuso una perspectiva más amplia: tanto los humanos como los animales son replicadores. ¿Qué significa eso? Transmitimos nuestros genes de generación en generación mediante la replicación genética. Somos muy inteligentes, pero no entendemos realmente cómo funciona nuestra inteligencia. ¿Puedes explicar cómo tu cerebro aprende a montar en bicicleta? La aparición de la IA marca nuestra entrada en la era del diseño. Estos agentes están diseñados para que (teóricamente) sepamos qué está haciendo cada capa de su red neuronal. En el futuro, estas IA podrán diseñar nuevas IA. Pero Sutton nos recuerda que antes de diseñar, primero debemos entender la inteligencia que la naturaleza ya ha "diseñado", es decir, los mecanismos de aprendizaje de los animales. Tal vez el verdadero avance no resida en permitir que la IA escriba mejor poesía. La idea es hacer que sea como una ardilla, capaz de explorar activamente entornos desconocidos, aprender continuamente y responder con flexibilidad a los cambios. Después de todo, los animales llevan cientos de millones de años desarrollando inteligencia. Nosotros apenas estamos empezando. --- Resumen generado por IA, formateado manualmente.
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.