Depois de testar mais um pouco a versão 5.2, posso dizer: Sim, é inteligente. Tem um "cheiro de modelo amplo", pois é quase como se mantivesse um contexto paralelo com sua própria perspectiva mais abrangente do problema. Flexível, mas inquebrável. É mais do que "vieses". Pensa *em torno* dos tokens renderizados.
Mas também, isso é parcialmente um estilo/truque. Este truque exige muita inteligência para ser executado. Mas é uma escolha de design arbitrária, não o produto de um salto de capacidade bruta que transborda para "hum, esse cara dos teoremas tributários não é tão inteligente assim". Mesmo assim, às vezes ele ainda apresenta objeções insensatas. um passo um pouco menor
Às vezes, fico surpreso com o quão pequeno Opus parece. Assim como acontece com o Sonnet, posso, sem querer, reduzi-lo a uma mera repetição (da qual ele pode ser resgatado). Suspeito que dependa da preservação do CoT. Preciso testar novamente.