フランスから愛がこもった、ミストラル3 ラージモデルが発売! しかし、到着が遅れたようです?今回、Mistral 3 LargeはついにMoEアーキテクチャにアップデートされ、パラメータ総数は675B、アクティベーションパラメータは41B、コンテキスト長は256Kになりました。 彼ら自身でテストした結果、ベースモデルがDeepSeek-V3.1よりも優れた性能を発揮したことがわかりました。しかし、以前のテストではMistralシリーズに強い印象を残さなかったため、まだ少し疑問が残っています。 さらに、Ministral 14B、8B、3Bも同時にリリースされました。公式チームは、これらを同様のパラメータサイズのQwen3モデルと直接比較しました。 多くの生徒が興味を持っていれば、全員に簡単なテストを実施することを検討します。
モデルパラメータ / 1
モデルのパフォーマンス








