Y solo se trata de destilación si se entrena con datos sintéticos de un modelo más grande. De lo contrario, se trata de una inicialización no aleatoria.
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.