昨天說洩漏的NVIDIA-Nemotron-3-Nano-30B-A3B結果今天發布囉! 這是一個結合Mamba-2 和Transformer的MoE模型,可以開啟或關閉推理,知識截止日期是2025年11月28日。 最亮眼的成績應該是數學能力測驗AIME25 刷到了89.1,如果讓這個模型使用工具,則能刷到99.2 (AIME25有幾題使用程式方法來解會更簡單)。程式能力測試LiveCodeBench (v6) 則是68.3,從這個分數來看屬於能用的程度。科學推理能力GPQA則是73。 作為對比,Qwen3-30B-A3B-Thinking-2507 的AIME25成績是85,LiveCodeBench (v6) 則是66. GPQA是73.4. 基本上Nemotron-3-Nano-30B-A3B是針對數學能力優化的模型。 不過Nemotron-3-Nano-30B-A3B還有個最大的好處是,它把預訓練和後訓練資料集全都開源了,所以作為用來學習和研究的模型是個不錯的選擇。 模型位址:
性能參數/1
性能參數/2







