在等待使用者實際回饋期間,Frontier 版本發布最有趣的部分之一就是檢查哪些評估結果還沒有失效。加油 FrontierMath!對 Putnam 來說有點遺憾,但 DeepSeek-Prover-2 > Seed-Prover 序列仍將是 LLM 數學史不可或缺的一部分。