RT @sayashk: CORE-Bench está resuelto (usando Opus 4.5 con Claude Code) TL;DR: La semana pasada, publicamos los resultados de Opus 4.5 en CORE-Bench, un…
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.