X (Twitter)

印度公司也開始用國產大模型了？剛剛又看到一個剪枝模型了！ MiniMax-M2-THRIFT。從250B剪到了192B，性能下降約5%。我覺得模型本身性能啥的倒無所謂，但自從llama倒下後，再到這個月已經有倆基於國產模型的剪枝模型(Kimi-Linear-REAP和MiniMax-M2-THRIFT)。雖然這個魔改模型可能不十分亮眼，但值得一提的是，這個模型的發布者叫VibeStudio，他們主打在雲端可以運行的vibe環境，試想一下一個在網頁中運行的VSCode+AI Agent 或者在網頁運行的ClaudeCode. 最大的優點是Vibe Everywhere. 介紹這個公司乾嘛呢？因為我搜了下這是一家印度公司，位置在金奈。而他們推理使用cerebras 服務, 模型則使用Kimi-K2. 便宜大碗優勢開始顯現。現在除了那些必須要站隊的公司（微軟，NVIDIA等）還在用llama3魔改，剩下的無論是新創公司還是算力服務商都在用國產開放權重模型了。開放權重模型的生態正被國產大模型不斷佔據。給力。模型位址：

模型數據

比較數據與他們公司頁面截圖

來自 karminski-牙医（@karminski3）的推文串

作者資訊

推文串內容