La gente subestima lo difícil que sería alinear a los agentes que aprenden exclusivamente de su propia experiencia con nuestros valores. Si bien la alineación de LLM se ha convertido en una especie de industria artesanal, ¡es un juego dx.com/rao2z/status/1… #NeurIPS2025
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.