我對 gpt-oss 模型進行微調的效果甚微,而對 qwen3 模型(甚至包括教學版本)的微調效果卻非常好。我不確定這是技能問題還是其他原因,但它們確實不太容易微調。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 1 則推文 · 2025年10月31日 下午6:32
我對 gpt-oss 模型進行微調的效果甚微,而對 qwen3 模型(甚至包括教學版本)的微調效果卻非常好。我不確定這是技能問題還是其他原因,但它們確實不太容易微調。