RT @classiclarryd:@varunneal 使用批量大小调度,创造了 NanoGPT 速通世界纪录,用时 132 秒,峰值达到了惊人的 30 步/秒!…
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年12月9日 02:13
RT @classiclarryd:@varunneal 使用批量大小调度,创造了 NanoGPT 速通世界纪录,用时 132 秒,峰值达到了惊人的 30 步/秒!…