如果你曾经好奇像 Kimi、DeepSeek 和 Qwen 这样的中国前沿模型是如何在数量远少于(并且性能被削弱的)英伟达 GPU 上进行训练的,那么答案就在这里。 1969 年,NASA 的阿波罗计划将人类送上月球,当时使用的计算机只有 4KB 的 RAM。 创造力喜欢限制。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年11月6日 16:43
如果你曾经好奇像 Kimi、DeepSeek 和 Qwen 这样的中国前沿模型是如何在数量远少于(并且性能被削弱的)英伟达 GPU 上进行训练的,那么答案就在这里。 1969 年,NASA 的阿波罗计划将人类送上月球,当时使用的计算机只有 4KB 的 RAM。 创造力喜欢限制。