這基本上是一份沒有授權的實驗室名單,以及快速跟進者名單。 RLVR 為小型開源模型帶來優勢 始終是去年 alpha 版本的概述。未提及 GRM。 Math-V2 看起來並不「非常新穎」。事後看來,我認為它的重要性將與 Math-V1 不相上下。
GRM 曾經意義重大,但鮮有人關注,儘管它與 DeepSeek R1 版本發布後的炒作浪潮幾乎同時出現。 Math-V2 和 V3.2 都藉鏡了它的理念。這一點終將得到認可。創新成果的傳播速度總是異常緩慢。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 2 則推文 · 2025年12月3日 清晨6:02
這基本上是一份沒有授權的實驗室名單,以及快速跟進者名單。 RLVR 為小型開源模型帶來優勢 始終是去年 alpha 版本的概述。未提及 GRM。 Math-V2 看起來並不「非常新穎」。事後看來,我認為它的重要性將與 Math-V1 不相上下。
GRM 曾經意義重大,但鮮有人關注,儘管它與 DeepSeek R1 版本發布後的炒作浪潮幾乎同時出現。 Math-V2 和 V3.2 都藉鏡了它的理念。這一點終將得到認可。創新成果的傳播速度總是異常緩慢。