Agora que finalmente tenho ambientes sintéticos controlados, estou vendo uma compensação semelhante no lado do pré-treinamento. Por exemplo, empilhar camadas é ainda mais benéfico para algumas tarefas/domínios (matemática) do que para outros.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.