Aposto que isso tem alguma relação com a atenção linear ou possivelmente com a decodificação especulativa.
Os erros de inferência relacionados a esses dois fatores podem ficar muito feios, na minha experiência.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.
2 tweets · 18 de dez. de 2025, 10:24
Aposto que isso tem alguma relação com a atenção linear ou possivelmente com a decodificação especulativa.
Os erros de inferência relacionados a esses dois fatores podem ficar muito feios, na minha experiência.