RT @Yangyixxxx: Publicaré el video traducido directamente en Twitter para que podamos aprender juntos. Este video te guiará en el repaso del mecanismo de atención y la generación autorregresiva, lo cual también es muy útil para que los principiantes comprendan los modelos grandes.
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.