愛來自法國, Mistral 3 Large 模型發布啦! 不過貌似趕了個晚集? 這次的Mistral 3 Large 終於更新為了MoE 架構,總參數量675B, 激活參數量41B, 上下文長度256K. 他們自己測試,基座模型表現上超過了DeepSeek-V3.1 不過我還是略表懷疑,因為Mistral 系列在我之前測試都沒有什麼深刻的印象。 另外本次還一併發布了Ministral 14B, 8B, 3B. 官方也是直接抓著Qwen3 的同等參數量大小的模型對比了一番. 如果有興趣的同學多我會考慮給大家做簡單測試.
模型參數/1
模型性能








