RT @mike64_t: Um lembrete amigável de que uma LSTM suficientemente dimensionada está arbitrariamente próxima do pico de MFU, chegando até mesmo a superar o Flash Attention…
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.