Mistral剛剛放出了:Mistral 3,以及其最強超大杯MoE:Mistral Large 3,擅長圖像理解、多語言對話 Mistral Large 3,總參數675B,啟動41B,同步放出base 和instruct 權重,推理版稍後發布 提供NVFP4壓縮格式,可在單節點8×A100/H100或Blackwell NVL72高效推理,支援TensorRT-LLM、SGLang、預填充/解碼分離、投機解碼等 Ministral 3系列有三種型號 3B、8B、14B,每個型號提供base、instruct、reasoning 三種變體,支援影像輸入 同量級最佳性價比,在性能上媲美同類模型的同時,生成的token數量少一個數量級 reasoning版可在14B上把AIME '25 做到85% #Mistral3 #MistralLarge3
部落格mistral.ai/news/mistral-3A Hhuggingface.co/collections/mi…3J


