X (Twitter)

[開源推薦] NVIDIA NeMo Skills NVIDIA 開源的工具集，專注於提升LLM 的各種"技能"，它是一個企業級端到端的完整開發框架，涵蓋了從資料生成到模型訓練再到評估的全流程。主要功能模組 1. 靈活的推理系統· 支援多種推理後端：可以在API服務、本地伺服器和大規模叢集之間自由切換· 整合主流推理引擎：TensorRT-LLM、vLLM、sglang和Megatron - 從單GPU到數萬GPU的彈性擴展能力 2. 全面的模型評估項目支援廣泛的評估基準測試，涵蓋多個關鍵領域： ·0數學推理：包括AIME、HMMT等競賽級題目· 形式化證明：支持Lean語言的定理證明（MiniF2F、ProofNet等） · 程式碼能力：SWE-bench、LiveCodeBench等實際程式設計任務· 科學知識：物理、化學、生物等領域的專業問題· 指令遵循、長上下文、工具調用、多語言、語音處理等其他維度 3. 模型訓練整合NeMo-RL和verl訓練框架，支援強化學習等高階訓練技術。重要成果計畫已經支持了NVIDIA多個重要的研究發布： · OpenReasoning系列：在數學、程式碼和科學推理上達到當時的SOTA水平·OpenMathReasoning：包含306K數學問題和320萬個詳細解答的數據集· OpenMathInstruct-2：1400萬數學問答對的大規模指令微調數據集技術特色 1. 模組化設計：各個組件可以獨立使用，也可以組合成完整的訓練-評估流水線 2. 規模彈性：同一套程式碼可以在筆記型電腦和超級電腦叢集上運行 3. 生態整合：深度整合NVIDIA的AI基礎設施與工具鏈開源專案

來自 meng shao（@shao__meng）的推文串

作者資訊

推文串內容