微博研發的VibeThinker-1.5B模型開源了,在三個困難數學測試集上超過DeepSeek-R1-0120,這說明小模型具有比業界認為高得多的發展潛力,但很多人可能沒有認識到這一點,這能讓大量缺乏GPU算力的研究人員加入大模型研發技術。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 1 則推文 · 2025年11月12日 凌晨2:43
微博研發的VibeThinker-1.5B模型開源了,在三個困難數學測試集上超過DeepSeek-R1-0120,這說明小模型具有比業界認為高得多的發展潛力,但很多人可能沒有認識到這一點,這能讓大量缺乏GPU算力的研究人員加入大模型研發技術。