RT @mike64_t: Un recordatorio amistoso: una LSTM suficientemente escalada se acerca arbitrariamente al máximo de MFU, llegando incluso a superar a Flash Attention g…
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.