草圖模型是一個較小的模型,規格解碼技巧是為了提高速度。 因此,你在兩個方面都得到了改進——質量(選擇更大的型號)和速度(提前收集 sft 樣本)。起草/蒸餾模型的選擇以及根據訓練的基礎模型是否具有良好的先驗知識而選擇的領域,都會影響兩種方法之間的任何一對一比較。