RT @rosinality:與 BFloat16 相比,FP16 的訓練-推理差距較小,因此更適合強化學習。即使 R… 之間的差異
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 1 則推文 · 2025年10月31日 下午3:58
RT @rosinality:與 BFloat16 相比,FP16 的訓練-推理差距較小,因此更適合強化學習。即使 R… 之間的差異