実際のユーザーからのフィードバックを待つ間、Frontier リリースで唯一興味深いのは、どの評価がまだ腐っていないかを確認することです。FrontierMath を応援しましょう。
Putnam にとっては少し残念ですが、DeepSeek-Prover-2 > Seed-Prover のシーケンスは、LLM 数学の歴史において依然として不可欠な部分となるでしょう。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。