RT @rosinality: FP16 pode ter uma diferença menor entre treinamento e inferência em comparação com BFloat16, sendo assim mais adequado para RL. Mesmo a diferença entre R…
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.