X (Twitter)

Claude Opus 4.5 est disponible : le modèle d’utilisation du codage, des agents et des ordinateurs le plus puissant ; utilisation des jetons considérablement réduite ; prix réduit d’un tiers par rapport à Opus 4.1 ; le score SWE-bench Verified dépasse les 80 points pour la première fois. Performances exceptionnelles en programmation : Opus 4.5 a obtenu un score de 80,9 % au test SWE-bench Verified, surpassant ainsi Google Gemini 3 Pro (76,2 %) et OpenAI GPT-5.1-Codex-Max (77,9 %). Plus impressionnant encore, lors des tests internes d’ingénierie des performances d’Anthropic, Opus 4.5 a surpassé tous les candidats humains. • Capacités de l'agent : Obtention d'un score de 66,3 % au test d'utilisation informatique OSWorld, témoignant d'un comportement résolument orienté vers les objectifs à long terme. Les testeurs internes ont indiqué qu'Opus 4.5 est capable de gérer des tâches que Sonnet 4.5 ne pouvait pas accomplir il y a quelques semaines et qu'il peut trouver des solutions de manière autonome face à des bogues complexes affectant plusieurs systèmes. • Amélioration de l'efficacité : Il s'agit d'une amélioration significative. Lors du traitement de tâches de codage de longue durée, Opus 4.5 utilise jusqu'à 65 % de jetons en moins tout en maintenant, voire en améliorant, la qualité du résultat. Cela se traduit par des coûts réduits et des temps de réponse plus rapides. Cette révolution tarifaire fixe le prix à 5 $ par million de jetons d'entrée et à 25 $ par million de jetons de sortie, soit une réduction des deux tiers par rapport aux 15 $/75 $ de la version précédente d'Opus 4.1. Grâce à cette évolution, les fonctionnalités d'Opus deviennent accessibles pour la première fois, permettant ainsi à ce modèle de s'imposer comme une solution de choix au quotidien. Mise à jour produit disponible sur plusieurs plateformes : Opus 4.5 est désormais disponible sur les applications Claude, les API et trois plateformes cloud majeures : Amazon Bedrock, Google Cloud Vertex AI et Microsoft Azure. Les développeurs peuvent l’utiliser avec l’identifiant de modèle claude-opus-4-5-20251101. Innovation technologique · Inférence hybride : Opus 4.5 prend en charge les modes de réponse instantanée et de réflexion approfondie. Les utilisateurs de l’API peuvent contrôler précisément la charge de calcul du modèle grâce au « paramètre d’effort », afin d’optimiser le compromis entre performance, latence et coût. • Gestion de la mémoire améliorée : des améliorations significatives ont été apportées à la gestion de la mémoire pour les opérations à contexte long, ce qui la rend particulièrement adaptée aux scénarios d’agents — Opus peut agir comme agent maître pour commander un groupe de sous-agents pilotés par Haiku. • Sécurité renforcée : Le modèle est plus résistant aux attaques par injection de signaux et présente un taux plus faible de comportements problématiques lors de l’évaluation du désalignement, ce qui en fait la version la plus sûre d’Anthropic à ce jour. positionnement sur le marché Opus 4.5 est principalement conçu pour les professionnels du savoir tels que les ingénieurs logiciels, les analystes financiers, les consultants et les comptables, ainsi que pour les scénarios nécessitant la gestion de tâches d'entreprise complexes et de flux de travail d'agents intelligents importants. Il s'agit d'un modèle haut de gamme adapté aux situations où les modèles précédents ne permettaient pas de résoudre le problème et où la performance est essentielle. Impact sur le secteur : Cette version intervient dans un contexte de forte concurrence dans le domaine de l’IA. Gemini 3 de Google, une semaine seulement après sa sortie, a déjà fait sensation sur le marché, le PDG de Salesforce ayant même annoncé son passage de ChatGPT à Gemini. Le lancement d’Opus 4.5 témoigne de la détermination et de la capacité d’Anthropic à conserver sa position de leader dans cette course.

Fil de meng shao (@shao__meng)

Informations sur l'auteur

Contenu du fil