공개된 가중치라는 점은 좋지만, dense 모델과 moe 모델을 비교하고 전체 매개변수만 보는 것은 꽤 불공평합니다. 전체 매개변수 대신 활성 매개변수를 보면 이야기가 달라집니다. - GLM 4.6(32B): 74% 감소 - Minimax M2(10B): 92% 감소 - K2 사고(32B): 74% 적음 - V3.2(37B): 70% 감소 크기(전체 또는 활성!)는 여기서 올바른 측정 기준이 아니며 vllm/sglang에서 속도와 동일한 그래프를 가져야 합니다.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
