我对 gpt-oss 模型进行微调的效果甚微,而对 qwen3 模型(甚至包括教学版本)的微调效果却非常好。我不确定这是技能问题还是其他原因,但它们确实不太容易进行微调。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年10月31日 18:32
我对 gpt-oss 模型进行微调的效果甚微,而对 qwen3 模型(甚至包括教学版本)的微调效果却非常好。我不确定这是技能问题还是其他原因,但它们确实不太容易进行微调。