昨日のGPT5.1リリースにはベンチマークがないと誰もが不満を漏らしていましたが、今やベンチマークがあります。AIMEとTaubenchの小さな回帰に注目してください。これはベンチマークマックスではないという確信を高めます。 もっと一般的に言えば、消費者向け AI モデル ラボのモデル通信は 2 つに分割する必要があると思います。1 つは雰囲気用、1 つはオタク用。1 つはリズ、1 つはティズです。 大きな問題は、「AGI」が「1つのモデルですべてに対応」するべきかどうかです。GPT5までは答えは「はい」でした。今では、常に5つの規範と5つのコーデックスが存在するように見えます。@fidjissimoのブログ投稿では、製品レベルでは同じことが示唆されています。
openai.com/index/gpt-5-1-… cookbook.openai.com/examples/gpt-5… cookbook.openai.com/examples/build… これらはすべてプラットフォームリンクです: https://t.coplatform.openai.com/docs/guides/la…oplatform.openai.com/docs/pricingoplatform.openai.com/docs/models/Gp…oplatform.openai.com/docs/models/Gp…oplatform.openai.com/docs/models/Gp…oplatform.openai.com/docs/models/Gp…ocookbook.openai.com/examples/gpt-5…o/pnsRaFR5oA https://t.co/RtimCXf3AC https://t.co/0gWnxVtryk https://t.co/uPkxFwfgr9
