Esto es lo que realmente sucede con el modelo AR. El modelo aprende a transformar una distribución fija (la que proviene del generador aleatorio) en la distribución de tokens adecuada mediante los logits. 2/2
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.