很高興它是開放權重的,但是比較密集模型和低密度模型,只看總參數是不公平的,如果看有效參數而不是總參數,情況就不同了: - GLM 4.6 (320億):減少74% - Minimax M2 (10B):減少 92% - K2思維(32B):減少74% - V3.2 (37B):減少 70% 這裡用大小(無論是總大小還是活躍大小!)來衡量並不合適,我們應該用 vllm/sglang 的速度來繪製相同的圖表。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
