没人尝试复现这些论文。我觉得这太不可思议了。Whale 的论文也一样,直到他们推出 R1,彻底碾压开源竞争对手,证明了他们的 DS-MoE+DSMath+GRPO 技术栈的优越性。现在它已经成为默认设置。但他们规模“小”。GDM 就是 GDM。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年12月6日 21:51
没人尝试复现这些论文。我觉得这太不可思议了。Whale 的论文也一样,直到他们推出 R1,彻底碾压开源竞争对手,证明了他们的 DS-MoE+DSMath+GRPO 技术栈的优越性。现在它已经成为默认设置。但他们规模“小”。GDM 就是 GDM。