RT @jackcookjack:用 NVFP4 训练 LLM 很困难,因为 FP4 的值太少了,我只能把它们全部写在这篇文章里:±{0, 0.5, 1, 1.5, 2,…
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年12月2日 18:08
RT @jackcookjack:用 NVFP4 训练 LLM 很困难,因为 FP4 的值太少了,我只能把它们全部写在这篇文章里:±{0, 0.5, 1, 1.5, 2,…