Tenho constatado, sem análise racional, que o Opus 4.5 é pior que o Soneto. Algum suporte quantitativo para essa observação:
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.