Amp a remplacé le modèle par défaut Gemini 3 par le Claude Opus 4.5, et lors de tests en conditions réelles, il a démontré une mise à niveau complète à un coût étonnamment bas. Ce changement rapide est survenu une semaine seulement après qu'AmpCode ait remplacé son modèle principal Claude par Gemini 3, une décision alors qualifiée d'« historique ». Désormais, l'entreprise est rapidement revenue à la version plus récente de Claude, Opus 4.5. La raison ? Si Gemini 3 offre d'excellentes performances, il présente également des défauts importants : des problèmes considérés comme des « imperfections » lors des tests internes se traduisaient par une expérience utilisateur très frustrante et coûteuse. Avantages et performances du Claude Opus 4.5 : L’Opus 4.5 offre des performances comparables à celles du Gemini 3. Bien que ses performances maximales ne soient pas aussi impressionnantes, il se distingue par une stabilité et une fiabilité accrues, sans faiblesses notables. • Vitesse accrue : Temps de réponse plus rapide en utilisation réelle. • Un rapport coût-efficacité exceptionnel : Bien que les jetons Opus soient plus chers individuellement, leur coût d’utilisation réel est inférieur. Voici quelques raisons : • Moins de jetons sont nécessaires pour accomplir les tâches. • Moins d'erreurs, ce qui réduit le gaspillage de jetons. • Moins d'intervention humaine est nécessaire (amélioration du taux d'accès au cache, réduction supplémentaire des coûts et de la latence) Comparaison de données spécifiques : Précision : Opus 4.5 (57,3 %) > Gemini 3 (53,7 %) > Sonnet 4.5 (37,1 %) • Coût moyen du fil : Opus 4.5 (2,05 $) ≈ Gemini 3 (2,04 $) < Sonnet 4.5 (2,75 $) • Coût de l’emballement du contrôle : Opus 4.5 (2,4 %) est significativement inférieur à Gemini 3 (17,8 %) et Sonnet 4.5 (8,4 %). • Vitesse : Sonnet 4.5 (2,4 minutes) est le plus rapide, Opus 4.5 (3,5 minutes) est plus rapide que Gemini 3 (4,3 minutes). Cas d'utilisation recommandés pour Opus 4.5 : • Avantage significatif en termes de coûts pour la gestion des longs flux de dialogue (plus de 200 000 jetons). • Lorsque d'autres modèles rencontrent des goulots d'étranglement en termes de capacité ou d'erreurs fréquentes. • Pour la gestion de tâches plus complexes et ambiguës. Adresse de l'article
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.
