Cerebras가 또 한 번 일을 냈습니다! 기능이 간소화된 DeepSeek-V3.2 버전을 출시했습니다. 두 가지 버전은 각각 508B와 345B로, 크기가 25%와 50% 감소했습니다. 이 버전들은 시스템 리소스가 제한적인 로컬 배포 환경에 적합합니다. REAP 가지치기 방법은 여전히 사용되고 있으며, 이 방법은 중복되는 전문가를 지능적으로 선택하고 제거하여 MoE 모델을 압축할 수 있습니다. 하지만 솔직히 말해서 논의가 필요한 몇 가지 사항이 있습니다. 첫째, Cerebras는 HumanEval과 MBPP 테스트 결과만 공개했을 뿐, 더 많은 테스트 결과를 제공하지 않았습니다. 이 두 테스트는 DeepSeek이 v3.2를 공식 출시했을 때 제공되지 않았습니다(아니면 제가 못 봤을 수도 있습니다). 또한, 345B는 이 두 테스트에서 508B보다 높은 점수를 받았습니다. 따라서 이 가지치기 모델을 대규모로 사용하려는 경우, 사용 전에 직접 성능을 테스트해 보는 것이 좋습니다.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
