X (Twitter)

愛來自法國, Mistral 3 Large 模型發布啦! 不過貌似趕了個晚集? 這次的Mistral 3 Large 終於更新為了MoE 架構，總參數量675B, 激活參數量41B, 上下文長度256K. 他們自己測試，基座模型表現上超過了DeepSeek-V3.1 不過我還是略表懷疑，因為Mistral 系列在我之前測試都沒有什麼深刻的印象。另外本次還一併發布了Ministral 14B, 8B, 3B. 官方也是直接抓著Qwen3 的同等參數量大小的模型對比了一番. 如果有興趣的同學多我會考慮給大家做簡單測試.

模型參數/1

模型性能

来自 karminski-牙医（@karminski3）的推文线程

作者信息

线程正文