미스트랄은 방금 미스트랄 3과 가장 강력한 초대형 MoE인 미스트랄 라지 3를 출시했습니다. 이 제품은 이미지 이해와 다국어 대화에 탁월합니다. 미스트랄 라지 3, 총 매개변수 675B, 활성화 41B, 기본 가중치와 지시 가중치를 동시에 해제합니다. 추론 버전은 나중에 출시될 예정입니다. NVFP4 압축 형식을 제공하여 8×A100/H100 또는 Blackwell NVL72를 사용하는 단일 노드에서 고효율 추론을 구현하고 TensorRT-LLM, SGLang, 사전 채우기/디코드 분리, 추측 디코딩 등을 지원합니다. 미니스트랄 3 시리즈에는 3가지 모델이 있습니다. 3B, 8B, 14B 모델은 각각 기본, 지시, 추론의 세 가지 변형을 제공하며 모두 이미지 입력을 지원합니다. 이 제품은 동급 제품 중 가격 대비 성능이 가장 뛰어나며, 성능은 유사 모델과 비슷하면서도 토큰 사용량은 훨씬 적습니다. 추론 버전은 14B에서 85% AIME '25를 달성할 수 있습니다. #미스트랄3 #미스트랄라지3
블로그mistral.ai/news/mistral-3mA huggingface.co/collections/mi…gF3J


