印度公司也開始用國產大模型了? 剛剛又看到一個剪枝模型了! MiniMax-M2-THRIFT。 從250B剪到了192B,性能下降約5%。我覺得模型本身性能啥的倒無所謂,但自從llama倒下後,再到這個月已經有倆基於國產模型的剪枝模型(Kimi-Linear-REAP和MiniMax-M2-THRIFT)。 雖然這個魔改模型可能不十分亮眼,但值得一提的是,這個模型的發布者叫VibeStudio,他們主打在雲端可以運行的vibe環境,試想一下一個在網頁中運行的VSCode+AI Agent 或者在網頁運行的ClaudeCode. 最大的優點是Vibe Everywhere. 介紹這個公司乾嘛呢?因為我搜了下這是一家印度公司,位置在金奈。而他們推理使用cerebras 服務, 模型則使用Kimi-K2. 便宜大碗優勢開始顯現。 現在除了那些必須要站隊的公司(微軟,NVIDIA等)還在用llama3魔改,剩下的無論是新創公司還是算力服務商都在用國產開放權重模型了。開放權重模型的生態正被國產大模型不斷佔據。給力。 模型位址:
模型數據
比較數據與他們公司頁面截圖








