當然,DeepSeek 內部也使用了快取。在 pass@5 的情況下,其性能達到 70.2,仍然與 Opus 4.5 相當,而成本卻低得多,真正遜色的只有 GPT 5.2 和設計精良的工具系統。這應該能讓你對下一代演算法的 pass@1 效能上限有所了解。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 1 則推文 · 2025年12月17日 晚上9:32
當然,DeepSeek 內部也使用了快取。在 pass@5 的情況下,其性能達到 70.2,仍然與 Opus 4.5 相當,而成本卻低得多,真正遜色的只有 GPT 5.2 和設計精良的工具系統。這應該能讓你對下一代演算法的 pass@1 效能上限有所了解。