평가는 약간 엉성하고, Terminus와 호환되지 않으며, 테스트 사례의 20% 이상에서 맥락을 벗어난다는 사실에도 불구하고 "실제" 검색 에이전트 점수를 외삽합니다. 여전히 생각이 너무 많기 때문입니다. 하지만 방향적으로는 SoTA와 가깝습니다.
"DeepSeek-V3.2-Speciale는 ICPC WF 2025에서 2위, IOI 2025에서 10위를 차지했습니다." IMO에서는 35/42(P6를 제외한 모든 점수), CMO에서는 102/126점을 기록했습니다. Math-V2의 성능을 통합했습니다. 도구 없음, 최대 128K 생성. Gemini에 비해 토큰 효율성이 낮음.


