Kimi-K2-ThinkingとMiniMax M2を比較するとどうなりますか? 1/n どちらもインターリーブツール呼び出しをサポート MiniMax M2 は厳しい戦いを強いられるでしょう。独自のニッチ市場を築いています。 196,600トークンのコンテキストウィンドウを備えています。このモデルのコストは、入力トークン100万トークンあたり0.15ドル、出力トークン100万トークンあたり0.45ドルです。 下のグラフと比較すると、MiniMax M2 は Kimi-K2-Thinking に比べて文字通り 75 ~ 80% 安価です。 しかし、Kimi-K2-Thinkingをキャッシュと組み合わせて使用し、コンテキストが長く、キャッシュヒットが複数回発生すると、興味深い状況になります。入力トークンに対するKimi K2の価格は、MinMax M2レベルまで下がります。
Kimi-K2-Thinking と MiniMax M2 のサイズを比較するとどうなりますか? 2/n 1. MiniMax M2 には、10B のアクティブ パラメータと、完全な注意を払うと合計 230B のパラメータがあります。 2. Kimi K2 には 350 億のアクティブ パラメータと合計 1 兆のパラメータがあります。 どちらも重みのほとんどは 8 ビットです。 つまり、M2 のホスティングははるかに簡単になり、KV キャッシュははるかにコンパクトになります。 MiniMax M2 は完全な注意力を使用しますが、Kimi-M2 が注意力層に何か興味深いことを行ったかどうかを確認するのは興味深いでしょう。 (この計算では、Kimi-K2-ThinkingはKimi-K2-Baseに基づいていると仮定しています)
