Meituan が新しいハード数学ベンチマークを開発しただけでなく、オープンソースの競合 2 社 (DS と Qwen。K2 の考え方は、このデータ マスター クラブにおける Kimi の地位を確固たるものにするはずです) に負けたと報告したことは、非常に尊敬に値します。 ところで、もう一度言いますが、LongCat は本当にクールなモデルです。
DeepSeekは、推論モデルの2つのメジャーアップデート(R1 <<< R1-0528 << V3.1)でMAFが大幅に向上しました。V3.2-expはV3.1と同じだと思います。V3.2-expを軽視している人は、かなり誤解しているようです。

