É uma grande honra ter @leerob abrilhantando o palco do AIE pela primeira de muitas vezes, espero. A execução do Cursor é de nível internacional e eu aprecio muito o nível de detalhamento que Lee apresentou na arquitetura e no treinamento do Composer — dê uma olhada nos kernels MXFP8 personalizados utilizados, no balanceamento de carga do @anyscalecompute Ray e na reutilização/design do backend de produção do Cloud Agent para treinamento. Confira esta visualização do painel interno da frota de treinamento deles! E, claro, nenhum treinamento de RL está completo sem um gráfico de eixo x logarítmico com crescimento suave...
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.


