官方的 SYNTH NanoChat 英文数据集即将发布:有 NanoChat 训练经验的朋友愿意测试/探讨一下最佳方案吗?通常只需要进行少量调整(数据集已经分片),但 FineWeb 的数据集导入脚本是硬编码的。否则,主 .sh 文件应该主要是一个简化版本:使用 SYNTH 时,您不需要单独的训练前/训练中/训练后阶段。