« Je te l'avais bien dit. » > Nous avons été surpris de constater que Claude Code avec Opus 4.5 a largement surpassé le modèle CORE-Agent, même sans corriger les cas de test incorrects (78 % contre 42 %). Nous ignorons la cause de cette différence. Une hypothèse est que les modèles de la série Claude 4.5 sont bien mieux adaptés au code Claude. > Nous pensons que l'étude du couplage entre les modèles et les échafaudages constitue une orientation de recherche importante pour l'avenir.
Il y avait tellement d'opinions farfelues à cette époque, les gens posaient des questions dans les publications et discutaient dans les groupes de discussion pour savoir pourquoi. Mais près de 9 mois plus tard, une seule réponse l'emporte.
