Lo más interesante del lanzamiento de Frontier, mientras se espera la retroalimentación de los usuarios, es comprobar qué evaluaciones aún no han fallado. ¡Vamos, FrontierMath!
Es un poco triste para Putnam, pero la secuencia DeepSeek-Prover-2 > Seed-Prover seguirá siendo una parte integral de la historia de las matemáticas de LLM.