Opus、Gemini、DeepSeekのいずれも、証明C(DeepSeek)が人間によって書かれた、あるいは実際にDeepSeekから生成されたものであると結論付けているのは注目に値します。GPT 5.1はこれを「人間」とラベル付けし、自身の出力(評価は2/10!)と実際の人間による証明の両方を自身に割り当てています。 注目すべきは、DS-Math V2のOpusです。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
