Todo mundo fica dizendo que o escalonamento do pré-treinamento acabou, como se o escalonamento tivesse parado de funcionar — mas, na verdade, ele não parou de funcionar, apenas começou a se tornar cada vez menos tratável porque é não linear, exatamente como previsto.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.