X (Twitter)

オープンウェイトであることは良いことですが、密なモデルと萌えモデルを比較し、合計パラメータのみを見るのはかなり不公平です。合計パラメータではなくアクティブパラメータを見ると話は別です。 - GLM 4.6 (32B): 74%減少 - ミニマックスM2（10B）：92％減少 - K2思考（32B）：74％減少 - V3.2 (37B): 70% 削減サイズ（合計またはアクティブの両方）はここでは適切な指標ではありません。vllm / sglangの速度で同じグラフが必要です。

elie（@eliebakouch）のスレッド

作者情報

スレッド内容