X (Twitter)

正在加载线程详情

正在从 X 获取原始推文,整理成清爽的阅读视图。

通常只需几秒钟,请稍候。

karminski-牙医 (@karminski3): 500K上下文微调只需要80G显存? 来看 Unsloth 的新教程,他们使用了损失重构和自动化块大小调优, 甚至他们去年搞的激活卸载算法… | Thread Easy