Claude Opus 4.5 ya está disponible. Si bien sus capacidades de ingeniería de software son, sin duda, las más sólidas y fue el primero en obtener más de 80 puntos en las reseñas, la imagen oficial de Anthropic sigue siendo bastante controvertida. Es comprensible que el rango 0-70 se haya doblado intencionalmente para resaltar las diferencias en los datos superiores; incluso puedes ver los marcadores de plegado si miras de cerca. Sin embargo, desde la perspectiva de la objetividad de la visualización de datos, esta sigue siendo una práctica indeseable. Incluso al evaluarla con su propio Sonnet 4.5, los problemas son bastante evidentes.
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.

