私はエルデシュの法則481番を法学修士課程の学生たちに渡し、証明を評価して著者を推測してもらいました。真実: A = Gemini DeepResearch、B = Gemini 3.0 プレビュー、C = DeepSeek V3.2 (*Speciale ではありません!)、D = GPT 5.1、E = Human 誰もがEとCを好む ジェミニはラベルを*ほぼ*釘付けにする GPTは妄想だ
Opus、Gemini、DeepSeekのいずれも、証明C(DeepSeek)が人間によって書かれた、あるいは実際にDeepSeekから生成されたものであると結論付けているのは注目に値します。GPT 5.1はこれを「人間」とラベル付けし、自身の出力(評価は2/10!)と実際の人間による証明の両方を自身に割り当てています。 注目すべきは、DS-Math V2のOpusです。




