NVIDIA 一個員工在上傳要開源的Nemotron-nano-3-30B-A3B 的時候, 一不小心把整個裝有所有模型的文件夾都上傳到了HuggingFace, 包括: EuroLLM-9B (歐盟資助的歐洲一些大學聯合開發的開放權重模型, 應該只是下載下來學習或參考) NVIDIA-Nemotron-3-Nano-30B-A3B-BF16-new-chat-template (Nemotron-3-Nano 的chat模板) NVIDIA-Nemotron-Nano-12B-v2 (NVIDIA 8月開源的模型) NVIDIA-Nemotron-Nano-31B-A3-v3 (一個內部版本, 之前沒有放出) NVIDIA-Nemotron-Nano-9B-v2-BF16 (NVIDIA 8月開源的模型) NVIDIA-Nemotron-Nano-9B-V2-EA (Early Access?) NVIDIA-Nemotron-Nano-9B-v2-NGC (NVIDIA GPU Cloud 版本?) NVIDIA-Nemotron-Nano-9B-v2-rc0807-safetensors (Release Candidate 發布候選版?) NVIDIA-Nemotron-Nano-9B-v2-rc0807 (Release Candidate 發布候選版?) NVIDIA-Nemotron-Nano-9B-v2.bak (備份?) NVIDIA-Nemotron-Nano-9B-v2 (NVIDIA 8月開源的模式) Nemotron-H-4B-Base-8K (NVIDIA 去年開源的模型) Nemotron-H-4B-Instruct-128K (NVIDIA 去年開源的模型) Nemotron-H-8B-Base-8K (NVIDIA 去年開源的模型) Nemotron-Nano-3-30B-A3.5B-dev-1016 (一個內部版本, 之前沒有放出) Nvidia-Nemotron-Nano-v2-9B-0805 (一個內部版本, 之前沒有放出) Qwen3-14B (千問哈哈哈哈哈, 估計也是用來研究?) Qwen3-8B (千問區) llama-3.1-nemoguard-8b-content-safety (NVIDIA 幾個月前開源的模型) nano-12b-v2-finalcheckpoint (一個內部checkpoint版本, 之前沒有放出) 目前來看應該沒太大的損失, 只是中間檢查點和一些內部版本被洩露了, 另外看起來應該NVIDIA-Nemotron-Nano 是有31B-A3B 或30B-A3.5B 的版本沒開源的. 估計是效果不理想?
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
