正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 1 則推文 · 2025年11月22日 晚上10:02
異常!由於 PyTorch 並未針對小型模型進行最佳化,PufferLib 的某些地方內核速度提升了 12 倍。正確性的驗證在於,除了數值檢查之外,我們是否還能繼續訓練模型。