"Mejores maneras de construir agentes que se mejoren a sí mismos" Pedí a ChatGPT que me escribiera un artículo que resumiera los enfoques para construir agentes automejorables, centrándose en 2025 artículos de Neurips encontrados usando @exaailabs. "papel" en el hilo 👇
Todavía se encuentra en su mayor parte en la fase de investigación, pero estamos viendo una variedad cada vez mayor de enfoques para ayudar a los agentes de IA a mejorar por sí mismos.
Las primeras investigaciones se centraron en almacenar "reflexiones"
Lo que dio lugar a agentes "autocorrectores"
Algunos enfoques del tipo árbol del pensamiento son otra variación. Pruebe múltiples caminos y elija el mejor.
agentes autodesafiantes
ejemplos en contexto (Siento que este enfoque debería haber venido antes de la reflexión, por lo que probablemente me faltan algunos artículos)
agentes múltiples que se mejoran a sí mismos
datos autogenerados
autoajuste fino
recompensas
Las recompensas son más fáciles con los agentes de codificación.
Agente de codificación que se mejora a sí mismo (así que es lo mío)
construir herramientas reutilizables
Espera, ¿esto no se superpone con secciones anteriores?
Hablando de otro aspecto del viajero y un enfoque similar.
seguridad y control
comparando patrones de diseño
¿Qué sigue?
referencias También la entrada complyoheinakajima.com/better-ways-to…s://t.co/nGKKLaJ5GN (Disculpen de antemano cualquier error o exclusión, no es mi culpa, lo hice yo)




















