Kimi-K2-Thinking 与 MiniMax M2 在尺寸上相比如何? 2/n 1. MiniMax M2 拥有 100 亿个有效参数和 230 亿个总参数,并受到充分关注。 2. Kimi K2 有 350 亿个活跃参数和 1 万亿个总参数。 它们的权重大多是 8 位的。 这意味着 M2 将更容易托管,其 KV 缓存也将更加紧凑。 MiniMax M2 使用了完整的注意力机制,看看 Kimi-M2 是否在注意力层做了一些有趣的改动,将会很有意思。 (以下计算假设 Kimi-K2-Thinking 是基于 Kimi-K2-Base 的)
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。