Kimi-Linear 剪枝版本! cerebras 好像找到流量密碼了, 開始瘋狂魔改國產大模型. (cerebras 是個基礎設施廠商提供硬體加速運行大模型, 他們能把大模型輸出打到2000 token/s) 剛剛又發布了Kimi-Linear-REAP-35B-A3B-Instruct, 沒錯, 就是前幾天的Kimi-Linear-48B-A3B-Instruct 魔改的. 參數從48B 剪枝到35B, 但性能反而還提升了? (魔改後通常會微調一波來保證效果) LiveCodeBench, AIME25, HumanEval 都有所上升. 我本地還在跑48B-A3B 的召回效果, 這倆我都測一下晚點給大家放出看看這個模型適不適合本地使用. 模型位址:
模型參數
效能數據







