科学的な直感を試すために、Opus 4.5 を深海に引き上げましたが、失望しました。 gpt 5.1 pro は、依然として最も信頼できる (ハードルは低い) 研究協力者です。Twitterのトップページのevalシグナルは私にとって何の役にも立たない