Claude Opus 4.5 est disponible. Bien que ses capacités d'ingénierie logicielle soient incontestablement les plus performantes et qu'il ait été le premier à obtenir plus de 80 points dans les tests, l'image officielle d'Anthropic reste très controversée. Il est compréhensible que la plage 0-70 ait été intentionnellement repliée pour mettre en évidence les différences dans les données de pointe ; on peut même voir les marques de pliage en regardant de près. Toutefois, du point de vue de l'objectivité de la visualisation des données, cette pratique reste regrettable. Même en l'évaluant à l'aide de son propre outil Sonnet 4.5, les problèmes apparaissent clairement.
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.

