DeepSeek 剛剛發布了新模型——DeepSeek-V3.2-Speciale! 從分數來看就是DeepSeek-V3.2-Exp 的最佳化版本了,數學能力測驗的AIME25 直接刷到了99.2 % 已經刷爆了,SWE-Bench Verified 也來到了73.1,距離claude-sonnet-4.5 的77.2 還有一些距離。 給大家整理了本次發布的重點內容,最重要的還是DeepSeek自己搞了個優化的稀疏注意力(稀疏注意力都是用來優化長上下文的,能在超長上下文中表現良好,並且節省資源)。原生上下文長度來到了163K。 其次我覺得最重要的是大規模智能體任務合成這個,現在大模型進化速度最大的限制其實是訓練材料,人工產生的已經很難滿足大模型訓練了,而DeepSeek探索出了一個自動合成Agent任務訓練數據的方法,這對大模型性能短時間迅速提升有至關重要的作用。 另外也提到了可擴展強化學習框架,這個光從模型卡介紹看不到具體細節,目前他們的技術報告還沒上傳,等上傳後我帶給大家詳細解讀。 以及,俺正在測了!稍後為大家帶來DeepSeek-V3.2-Speciale程式設計能力實測!
性能參數/2
性能參數/3











