어제 언급했던 유출된 NVIDIA Nemotron 3 Nano 30B A3B가 오늘 공식 출시되었습니다! 이 모델은 Mamba-2와 Transformer를 결합한 MoE 모델이며, 추론 기능을 활성화하거나 비활성화할 수 있습니다. 지식 공유 마감일은 2025년 11월 28일입니다. 가장 인상적인 성과는 AIME 25 수학 시험에서 89.1점을 획득한 것입니다. 만약 이 모델이 도구를 활용한다면 99.2점까지 도달할 수 있을 것으로 예상됩니다 (일부 AIME 25 문제는 프로그래밍 방식을 사용하면 더 쉽게 풀 수 있습니다). LiveCodeBench(v6) 프로그래밍 시험 점수는 68.3점으로, 활용 가능한 수준입니다. GPQA 과학적 추론 시험 점수는 73점입니다. 이에 비해 Qwen3-30B-A3B-Thinking-2507은 AIME25에서 85점, LiveCodeBench(v6)에서 66점, GPQA에서 73.4점을 기록했습니다. 본질적으로 Nemotron-3-Nano-30B-A3B는 수학적 능력에 최적화된 모델입니다. 하지만 Nemotron-3-Nano-30B-A3B의 가장 큰 장점은 사전 학습 및 사후 학습 데이터셋을 모두 오픈 소스로 제공한다는 점이며, 이는 학습 및 연구에 매우 적합한 선택이 됩니다. 모델 주소:
성능 매개변수 / 1
성능 매개변수 / 2







