微博首個大模型VibeThinker 1.5B 實測! 給大家帶來微博新出的的大模型VibeThinker 1.5B 實測, 官方說這是一個數學能力強化的模型. 首先我們還是來經典問題, strawberry 有幾個r? 這個問題輕鬆就回答對了。 則, 正餐登場, 我們來測試一道數學題, 1.(2016·中原名校聯盟一模)設A={1,4,2x},若B={1, x^2},且B⊆A,則x=? 這題的答案是x等於0或負2. 結果這個也回答正確! 那麼, 這個模型真的是微博評論羅伯特嗎? 讓我們來復現銳評這句話: 我這人有一個毛病,無病呻吟 原本羅伯特的評論是, 我也是, 咱倆可以一起呻吟. 結果模型回答了特別匪夷所思的對話, 其實這種情況隊醫1.5B規模的模型實屬正常, 這麼小規模的模型通常都是某項能力特化的, 而正常對話由於沒有很好的訓練或者參數支撐, 很容易回答得驢唇不對馬嘴. 不過我拉到最上面一看, 感覺是tokenizer 出了問題, 輸入沒有識別對. 考慮到這種規模的模型, 數學能力能達到這種效果, 的確牛皮, 微博趕緊把羅伯特開源啊.
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。