Esta é outra versão, um modelo com 19 milhões de parâmetros, após o processamento de 1 bilhão de tokens.
Quase consumiu todos os meus créditos do Colab; com poder computacional suficiente, pode ser totalmente treinado em apenas algumas horas.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.
2 tweets · 17 de nov. de 2025, 10:04
Esta é outra versão, um modelo com 19 milhões de parâmetros, após o processamento de 1 bilhão de tokens.
Quase consumiu todos os meus créditos do Colab; com poder computacional suficiente, pode ser totalmente treinado em apenas algumas horas.