A versão preta representa o transformador padrão de 1,5 bilhão de camadas com 28 camadas; a azul, o transformador gratuito do artigo do arXiv, com uma sobrecarga de 3,5% em computação e memória; e as versões vermelha e laranja, duas variantes da versão 2 com uma sobrecarga de 1,3% e código muito mais simples.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.
