正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年11月8日 13:02
RT @ShengyuanS:嗨 Dzmitry,我们的 INT4 QAT 仅使用权重并采用伪量化:我们在 for 循环期间将原始 BF16 权重保存在内存中……