Es un gran honor para mí contar con @leerob en el escenario de AIE por primera vez, espero, de muchas. La ejecución de Cursor es de primera clase y aprecio enormemente el detalle que Lee detalló sobre la arquitectura y el entrenamiento de Composer. Echen un vistazo a los kernels MXFP8 personalizados utilizados, el balanceo de carga de Ray de @anyscalecompute y la reutilización/diseño conjunto del backend de producción de Cloud Agent para el entrenamiento. ¡Vean esta visualización de su panel interno de entrenamiento! y, por supuesto, ningún entrenamiento RL está completo sin un gráfico del eje x del logaritmo que aumente suavemente...
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.


