正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年11月20日 14:08
这是一个很棒的帖子,其中包含一些基本的推理数学知识,有助于讨论训练 MoE 模型(相对而言)的可操作性。 我认为,除了本地使用之外,对于其他所有应用,MoE 显然更胜一筹。