オープンウェイトであることは良いことですが、密なモデルと萌えモデルを比較し、合計パラメータのみを見るのはかなり不公平です。合計パラメータではなくアクティブパラメータを見ると話は別です。 - GLM 4.6 (32B): 74%減少 - ミニマックスM2(10B):92%減少 - K2思考(32B):74%減少 - V3.2 (37B): 70% 削減 サイズ(合計またはアクティブの両方)はここでは適切な指標ではありません。vllm / sglangの速度で同じグラフが必要です。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
