X (Twitter)

멋지네요! DeepSeek에서 최신 모델 DeepSeek-Math-V2를 출시했습니다. IMO 금메달 수준에 도달한 모델이죠. DeepSeek-V3.2-Exp-Base, 685B를 기반으로 수학적 추론과 정리 증명에 중점을 둡니다. Math-V2는 단순히 답을 계산하는 것이 아닙니다. 완전한 증명을 생성하고, 심지어 자체 증명의 타당성을 검사할 수도 있습니다. IMO 2025와 CMO 2024에서 금메달 수준의 성적을 거두었고, 퍼트넘 2024에서는 118/120이라는 완벽한 점수를 거의 달성했습니다. 구체적으로, 정확하고 신뢰할 수 있는 검증자는 먼저 증명 과정이 엄격한지 여부를 판단하도록 훈련을 받습니다. 그런 다음 이 검증기를 보상 모델로 사용하여 증명 생성기를 훈련시켜 제출 전에 증명의 문제점을 사전에 식별하고 수정하도록 장려합니다. 생성기가 더욱 강력해질수록 검증을 위한 계산 부하가 지속적으로 증가하고, 검증하기 어려운 증명에는 자동으로 레이블이 지정되어 검증기의 학습에 피드백되고 개선을 위한 "생성-검증" 주기를 형성합니다. DeepSeekMath-V2는 단순히 답을 제공하는 데 그치지 않고 AI 수학에 근본적으로 혁명을 일으켰습니다. 이제 증명을 작성할 수 있을 뿐만 아니라 오류를 스스로 검사할 수도 있으며, 반복할 때마다 점점 더 엄격해지고 있습니다. #딥시크매스V2

모델:huggingface.co/deepseek-ai/De…I 논github.com/deepseek-ai/De…A2e

모델: https://t.co/Hmz6P83CsI
논문: https://t.co/yNtXy9pA2e

AIGCLINK(@aigclink)의 스레드

작성자 정보

스레드 내용