Après avoir davantage exploré la version 5.2, je peux dire Oui, c'est intelligent. Il présente une « odeur de grand modèle » car il semble maintenir un contexte parallèle avec sa propre perspective plus large du problème. Flexible, mais indestructible. Il ne s'agit pas seulement de « biais ». Il raisonne *autour* des jetons rendus.
mais c'est aussi en partie un style/un artifice. Il faut vraiment être intelligent pour mettre en œuvre ce stratagème. Mais il s'agit d'un choix de conception arbitraire, et non d'un bond en avant en termes de capacités brutes qui se traduirait par un « tiens, ce type de téortaxes n'est pas si intelligent que ça ». Il arrive encore parfois qu'il s'oppose à des choses absurdes. un pas un peu plus petit
Je suis parfois surpris de voir à quel point Opus paraît petit. Tout comme pour le sonnet, je peux involontairement le réduire à un simple exercice de répétition (dont il est possible de se sortir). Je soupçonne que cela repose sur la préservation du CoT. Il faut refaire les tests.