RT @PKirgis: En nuestras evaluaciones más recientes en @halevals, descubrimos que Claude Opus 4.5 resuelve el problema de CORE-Bench. ¿Cómo? Opus 4.5 resuelve CORE-Bench porque…
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.