¿eh @voooooogel @norvid_studies? Parece que no funciona la inducción. Escribí un pequeño script que prueba la capacidad de inducción (simplemente, la precisión en la segunda mitad de un conjunto de secuencias de la forma [a,b,c,d,e,f, a,b,c,d,e,f] donde a,b,c, etc. son tokens aleatorios). Y hay un cambio de fase claro alrededor de los 600 pasos, donde aprende la inducción. ¡Pero eso es un tiempo después del segundo golpe de pérdida!
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.
