正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年11月9日 09:57
现在我终于可以控制合成环境了,在预训练方面也看到了类似的权衡。比如,堆叠层对某些任务/领域(例如数学)的益处甚至比其他任务/领域更大。