もちろん、DeepSeekは自社製のキャッシュを搭載しています。pass@5 70.2では、Opus 4.5と同等の性能をわずかなコストで実現しており、GPT 5.2と優れた設計のツールシステムに劣る程度です。これは、次世代のpass@1の限界値を示す指標となるでしょう。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
1 件のツイート · 2025/12/17 21:32
もちろん、DeepSeekは自社製のキャッシュを搭載しています。pass@5 70.2では、Opus 4.5と同等の性能をわずかなコストで実現しており、GPT 5.2と優れた設計のツールシステムに劣る程度です。これは、次世代のpass@1の限界値を示す指標となるでしょう。