RT @Yangyixxxx: Vou postar o vídeo traduzido diretamente no Twitter para que todos possamos aprender juntos. Este vídeo irá guiá-lo na revisão do mecanismo de atenção e da geração autorregressiva, o que também é muito útil para iniciantes entenderem modelos grandes.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.