RT @fujikanaeda: se o SDG certo puder fazer com que um modelo de 50 milhões de parâmetros obtenha MMLU não aleatório. e consegue fazer um modelo 300M funcionar como um campeão. você…
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.