X (Twitter)

Que legal! A DeepSeek acaba de lançar seu modelo mais recente: DeepSeek-Math-V2, que atinge o nível de medalha de ouro na IMO (Ordem dos Milênios). Baseado em DeepSeek-V3.2-Exp-Base, 685B, com foco em raciocínio matemático e demonstração de teoremas. O Math-V2 não se limita a calcular respostas; ele gera demonstrações completas e pode até verificar a validade de suas próprias demonstrações. Obteve resultados dignos de medalha de ouro na IMO 2025 e na CMO 2024, e quase alcançou a pontuação perfeita de 118/120 na Putnam 2024. Especificamente, um verificador preciso e confiável é treinado inicialmente para determinar se o processo de comprovação é rigoroso. Em seguida, usando esse validador como modelo de recompensa, um gerador de provas é treinado para incentivá-lo a identificar e corrigir proativamente problemas na prova antes do envio. À medida que o gerador se torna mais poderoso, a carga computacional para verificação aumenta continuamente, e as provas difíceis de verificar são rotuladas automaticamente, retroalimentando o treinamento do verificador e formando um ciclo de "geração-verificação" para aprimoramento. O DeepSeekMath-V2 revolucionou essencialmente a matemática com IA, indo além da simples obtenção de respostas; agora ele consegue escrever demonstrações e, não só isso, como também pode verificar erros automaticamente, tornando-se cada vez mais rigoroso a cada iteração. #DeepSeekMathV2

Modhuggingface.co/deepseek-ai/De…83Csgithub.com/deepseek-ai/De…/yNtXy9pA2e

Modelo: https://t.co/Hmz6P83CsI
Artigo: https://t.co/yNtXy9pA2e

Thread de AIGCLINK (@aigclink)

Informações do autor

Conteúdo da thread