Meituan이 새로운 어려운 수학 벤치마크를 개발했을 뿐만 아니라, 오픈 소스 경쟁사 2곳(DS와 Qwen; K2 사고방식은 Kimi가 이 데이터 마스터 클럽에 속해 있음을 확실히 보여줄 것입니다)에게 졌다고 보고한 것은 매우 존경스럽습니다. 그런데 LongCat은 정말 멋진 모델이에요.
DeepSeek은 추론 모델의 두 가지 주요 업데이트(R1 <<< R1-0528 << V3.1)에서 mafs가 *상당히* 향상되었습니다. V3.2-exp는 V3.1과 동일한 것 같습니다. V3.2-exp를 무시하는 사람들은 완전히 착각하고 있는 겁니다.

