Kimi-K2-Thinking을 MiniMax M2와 비교하면 어떤가요? 1/n 둘 다 인터리브 도구 호출을 지원합니다. MiniMax M2는 치열한 경쟁을 펼칠 것으로 보이며, 자신만의 틈새시장을 개척했습니다. 196.6K 토큰의 컨텍스트 윈도우를 제공합니다. 이 모델의 비용은 입력 토큰 100만 개당 0.15달러, 출력 토큰 100만 개당 0.45달러입니다. 아래 차트와 비교해보면, MiniMax M2는 Kimi-K2-Thinking에 비해 문자 그대로 75-80% 저렴합니다. 하지만 Kimi-K2-Thinking을 캐싱과 함께 사용하면 흥미로운 상황이 발생합니다. 긴 컨텍스트와 여러 캐시 히트가 있는 경우, 입력 토큰에 대한 Kimi-K2 가격이 MinMax M2 수준으로 떨어집니다.
Kimi-K2-Thinking과 MiniMax M2의 크기를 비교하면 어떤가요? 2/n 1. MiniMax M2는 전체 주의력을 갖춘 10B 활성 매개변수와 230B 총 매개변수를 가지고 있습니다. 2. Kimi K2는 350억 개의 활성 매개변수와 1조 개의 총 매개변수를 가지고 있습니다. 둘 다 대부분의 가중치를 8비트로 갖습니다. 즉, M2는 호스팅하기가 훨씬 더 쉽고 KV 캐시도 훨씬 더 컴팩트해집니다. MiniMax M2는 전체 주의를 사용하는데, Kimi-M2가 주의 계층에 흥미로운 일을 했는지 보는 것은 흥미로울 것입니다. (이 계산을 위해 저는 Kimi-K2-Thinking이 Kimi-K2-Base를 기반으로 한다고 가정합니다)
