評估方法有點不完善,與 Terminus 不相容,儘管超過 20% 的測試用例結果超出上下文,但它們仍然推斷出「真實」的搜尋代理得分,這是因為它仍然過度思考… 但從方向上看,是的,它靠近SoTA。
「DeepSeek-V3.2-Speciale 在 2025 年 ICPC 世界錦標賽中排名第二,在 2025 年 IOI 中排名第十」。在 IMO 上獲得 35/42 分(即除了該死的 P6 之外的所有分數),在 CMO 上獲得 102/126 分。它融合了 Math-V2 的強大功能。 無需工具,最多可產生 128K 個代幣。與 Gemini 相比,代幣效率較低。


