Isso era verdade para RL com modelos pequenos. As bibliotecas mais utilizadas treinavam linhas de base padrão a 500-5 mil passos por segundo. Com a PufferLib, estamos treinando a 500 mil-5 milhões de passos por segundo, e até mais rápido a cada atualização!
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.