As avaliações são um tanto incompletas, não são compatíveis com o Terminus e extrapolam a pontuação "real" do agente de busca, apesar de ela exceder o contexto em mais de 20% dos casos de teste. Isso ocorre porque o sistema ainda analisa os dados em excesso... Mas em termos de direção, sim, está perto do SoTA.
“DeepSeek-V3.2-Speciale ficou em 2º lugar no ICPC WF 2025 e em 10º no IOI 2025”. 35/42 (ou seja, tudo exceto aquele maldito P6) na IMO, 102/126 na CMO. Incorpora os recursos do Math-V2. Sem ferramentas, geração máxima de 128 mil tokens. Ineficiente em termos de tokens em comparação com o Gemini.


