Kimi-K2-Thinking 與 MiniMax M2 相比如何? 1/n 兩者都支援交錯式工具調用 MiniMax M2 將與它展開激烈的競爭——它已經開闢了自己的市場。 它包含一個 196.6 萬個代幣的上下文視窗。該模型的輸入成本為每百萬個代幣 0.15 美元,輸出成本為每百萬個代幣 0.45 美元。 與下圖相比,MiniMax M2 的價格比 Kimi-K2-Thinking 便宜 75-80%。 但當您將 Kimi-K2-Thinking 與緩存結合使用,並且擁有較長的上下文和多次緩存命中時,情況就變得有趣了。此時,Kimi K2 輸入代幣的價格會降至 MinMax M2 的水平。
Kimi-K2-Thinking 與 MiniMax M2 在尺寸上相比如何? 2/n 1. MiniMax M2 擁有 100 億個有效參數和 230 億個總參數,並受到充分關注。 2. Kimi K2 有 350 億個活躍參數和 1 兆個總參數。 它們的權重大多是 8 位的。 這意味著 M2 將更容易託管,其 KV 快取也將更加緊湊。 MiniMax M2 使用了完整的注意力機制,看看 Kimi-M2 是否在註意力層做了一些有趣的改動,將會很有意思。 (以下計算假設 Kimi-K2-Thinking 是基於 Kimi-K2-Base 的)
