沒人嘗試復現這些論文。我覺得這太不可思議了。 Whale 的論文也一樣,直到他們推出 R1,徹底碾壓開源競爭對手,證明了他們的 DS-MoE+DSMath+GRPO 技術堆疊的優越性。現在它已經成為預設值。但他們規模「小」。 GDM 就是 GDM。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 1 則推文 · 2025年12月6日 晚上9:51
沒人嘗試復現這些論文。我覺得這太不可思議了。 Whale 的論文也一樣,直到他們推出 R1,徹底碾壓開源競爭對手,證明了他們的 DS-MoE+DSMath+GRPO 技術堆疊的優越性。現在它已經成為預設值。但他們規模「小」。 GDM 就是 GDM。