RT @scaling01: Claude 4.5 Opus domina otro benchmark de codificación AutoCodeBench-V2 consta de 1000 problemas seleccionados y refinados iterativamente…
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.