我们特意限制了训练后的训练,以便社区能够进一步进行专业化研究。为了体现模型的未开发潜力,我们报告了在硬代码生成、智能体和数学基准测试中通过率达到 pass@{1,2,4,8} 的结果。 太棒了!令人兴奋的发布。
你训练后的模型应该是“未完全成熟”的……
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 2 条推文 · 2025年12月6日 04:15
我们特意限制了训练后的训练,以便社区能够进一步进行专业化研究。为了体现模型的未开发潜力,我们报告了在硬代码生成、智能体和数学基准测试中通过率达到 pass@{1,2,4,8} 的结果。 太棒了!令人兴奋的发布。
你训练后的模型应该是“未完全成熟”的……