> evaluación de alucinaciones/conocimiento Como era de esperar, reproduce *muy* bien la escala del modelo en bruto de los abiertos. Creo que la versión 3.2 podría intercambiar posiciones con la 0528 tras la corrección de errores. La única pregunta es: *Haiku*?
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.