El paso de los modelos base a los agentes refleja con qué quieren interactuar los usuarios. - chat interactivo —> entrenar para modelos de chat - realizar acciones en el chat —> entrenar para el uso de herramientas - acciones de largo horizonte, autonomía —> RL para comportamiento agente La mayoría de la gente probablemente prefiera hablar con un agente, por eso Claude Code ahora solo está en la aplicación.
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.