A versão especial dsv3.2 pensa muito mais do que qualquer outro modelo. Em 4 de 8 avaliações, V3.2-Speciale pensa *menos* que Kimi-K2-Thinking. Em 3, mais; para o Codeforces, não há dados de Kimi. Um AdamW sete meses mais velho, 33% menor, com atenção reduzida, solto sem restrições, conquista o K2 com facilidade.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.

