Weibo初の大型モデル「VibeThinker 1.5B」のテストが行われました! Weiboで新しくリリースされたVibeThinker 1.5Bモデルのハンズオンレビューをご紹介します。公式の説明によると、数学的能力が強化されたモデルとのことです。 定番の質問から始めましょう。「イチゴには「r」がいくつありますか?」この質問に正しく答えるのは簡単です。 さて、本題に入りましょう。数学の問題で知識を試してみましょう。1. (2016·中原名門校連合模擬試験) A = {1, 4, 2x} とします。B = {1, x^2} かつ B⊆A ならば、x = ? この問題の答えは、xは0か-2です。そして、この答えも正解でした! それで、このモデルは本当にロバートのWeiboコメントなのでしょうか? この解説からの引用を繰り返しましょう: 私には問題があります。理由もなく愚痴を言ってしまうのです。 ロバートの最初のコメントは、「私もです。一緒にうめきましょう。」でした。 モデルは、かなり不合理な会話に反応しました。実際、チームドクターのような15億規模のモデルでは、これはごく普通のことです。このような小規模モデルは通常、特定の能力に特化しており、適切なトレーニングやパラメータのサポートがなければ、通常の会話に対して意味不明な返答をしてしまう可能性があります。 しかし、一番上までスクロールしてみると、トークナイザーに問題があるように感じました。入力が正しく認識されていないのです。 モデルの規模を考えると、この結果を達成した数学的能力は実に印象的です。Weiboはロバートの成果を早急にオープンソース化すべきです!
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。