X (Twitter)

正在載入線程內容

正在從 X 取得原始推文,整理成清爽的閱讀畫面。

通常只需幾秒鐘,請稍候。

karminski-牙医 (@karminski3): 500K上下文微调只需要80G显存? 来看 Unsloth 的新教程,他们使用了损失重构和自动化块大小调优, 甚至他们去年搞的激活卸载算法… | Thread Easy