V3 版本在 R1 版本发布前三周宣布“我们将持续探索并迭代模型的深度思考能力”。此外,还实现了“无限上下文”(但最大上下文数仍为 128k)。V3.2 版本则宣布提升计算能力,并改进 CoT 的效率。 所以,这个大型培训计划,究竟是几周还是几年?
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年12月1日 13:55
V3 版本在 R1 版本发布前三周宣布“我们将持续探索并迭代模型的深度思考能力”。此外,还实现了“无限上下文”(但最大上下文数仍为 128k)。V3.2 版本则宣布提升计算能力,并改进 CoT 的效率。 所以,这个大型培训计划,究竟是几周还是几年?