抱歉,噪音什么的,但是 o1-high 的性能比 o1-preview 强太多了,“最符合常识的基准测试”应该能看出这一点。 是的,这就是专有模型具有优势的地方。 我认为这取决于我们是否拥有几个高质量的人工编写的数据集。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年11月8日 07:56
抱歉,噪音什么的,但是 o1-high 的性能比 o1-preview 强太多了,“最符合常识的基准测试”应该能看出这一点。 是的,这就是专有模型具有优势的地方。 我认为这取决于我们是否拥有几个高质量的人工编写的数据集。