仔细观察V3.2阶段,你会发现其架构和方法都体现了一种非常连贯的理念。它并非“V3+”,而是一次相当于一到两代模型改进的升级,同时省略了新的预训练。如果V4仅仅基于大量V3.2时代的合成数据集进行训练,它的性能将会非常强大。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年12月3日 19:37
仔细观察V3.2阶段,你会发现其架构和方法都体现了一种非常连贯的理念。它并非“V3+”,而是一次相当于一到两代模型改进的升级,同时省略了新的预训练。如果V4仅仅基于大量V3.2时代的合成数据集进行训练,它的性能将会非常强大。