微博研發的VibeThinker-1.5B模型開源了,在三個困難數學測試集上超過DeepSeek-R1-0120,這說明小模型具有比業界認為高得多的發展潛力,但很多人可能沒有認識到這一點,這能讓大量缺乏GPU算力的研究人員加入大模型研發技術。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年11月12日 02:43
微博研發的VibeThinker-1.5B模型開源了,在三個困難數學測試集上超過DeepSeek-R1-0120,這說明小模型具有比業界認為高得多的發展潛力,但很多人可能沒有認識到這一點,這能讓大量缺乏GPU算力的研究人員加入大模型研發技術。