Kimi-K2-Thinking 与 MiniMax M2 相比如何? 1/n 两者都支持交错式工具调用 MiniMax M2 将与它展开激烈的竞争——它已经开辟了自己的市场。 它包含一个 196.6 万个代币的上下文窗口。该模型的输入成本为每百万个代币 0.15 美元,输出成本为每百万个代币 0.45 美元。 与下图相比,MiniMax M2 的价格比 Kimi-K2-Thinking 便宜 75-80%。 但当您将 Kimi-K2-Thinking 与缓存结合使用,并且拥有较长的上下文和多次缓存命中时,情况就变得有趣了。此时,Kimi K2 输入代币的价格会降至 MinMax M2 的水平。
Kimi-K2-Thinking 与 MiniMax M2 在尺寸上相比如何? 2/n 1. MiniMax M2 拥有 100 亿个有效参数和 230 亿个总参数,并受到充分关注。 2. Kimi K2 有 350 亿个活跃参数和 1 万亿个总参数。 它们的权重大多是 8 位的。 这意味着 M2 将更容易托管,其 KV 缓存也将更加紧凑。 MiniMax M2 使用了完整的注意力机制,看看 Kimi-M2 是否在注意力层做了一些有趣的改动,将会很有意思。 (以下计算假设 Kimi-K2-Thinking 是基于 Kimi-K2-Base 的)
