当然,DeepSeek 内部也使用了缓存。在 pass@5 的情况下,其性能达到 70.2,仍然与 Opus 4.5 相当,而成本却低得多,真正逊色的只有 GPT 5.2 和设计精良的工具系统。这应该能让你对下一代算法的 pass@1 性能上限有所了解。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年12月17日 21:32
当然,DeepSeek 内部也使用了缓存。在 pass@5 的情况下,其性能达到 70.2,仍然与 Opus 4.5 相当,而成本却低得多,真正逊色的只有 GPT 5.2 和设计精良的工具系统。这应该能让你对下一代算法的 pass@1 性能上限有所了解。