新影片上線-小模型,大吞吐!實測英偉達開源Nemotron 3 Nano 模型 本期影片我帶你快速過一遍技術報告,並做了一些實測。 影片裡你會看到: - Nemotron 3 Nano 的核心配置:參數規模、MoE + Mamba Transformer 架構、1M 上下文 - 25T 預訓練數據,兩階段課程學習+ SFT + RLVR + RLHF 的訓練流程 - 官方給出的量化方案:從BF16 到FP8,選擇性量化如何盡量「保分」 - Nano VS Qwen3 Next 真實任務:編碼+ 寫作
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
