X (Twitter)

Le premier modèle à grande échelle de Weibo, le VibeThinker 1.5B, a été testé ! Voici un test pratique du nouveau modèle VibeThinker 1.5B, publié sur Weibo. La description officielle indique qu'il s'agit d'un modèle aux capacités mathématiques améliorées. Commençons par la question classique : combien y a-t-il de « r » dans « fraises » ? Il est facile de répondre correctement à cette question. Passons maintenant au plat de résistance. Nous allons tester nos connaissances avec un problème de mathématiques : 1. (Examen blanc 2016 de l’Alliance des écoles renommées de Zhongyuan) Soit A = {1, 4, 2x}. Si B = {1, x^2} et B⊆A, alors x = ? La réponse à cette question est que x est égal à 0 ou à -2. Et cette réponse était correcte aussi ! Ce commentaire est-il vraiment celui de Robert sur Weibo ? Reprenons cette citation du commentaire : J’ai un problème : je me plains sans raison. Le commentaire initial de Robert était : « Moi aussi, on peut gémir ensemble. » Le modèle a répondu à des dialogues plutôt absurdes. En réalité, c'est assez courant pour un modèle à l'échelle 1,5 milliard comme le médecin de l'équipe. Ces modèles à petite échelle sont généralement spécialisés dans une capacité particulière et, sans entraînement adéquat ni paramétrage approprié, ils peuvent facilement donner des réponses incohérentes à des dialogues normaux. Cependant, en remontant en haut de la page, j'ai constaté un problème avec le tokenizer : l'entrée n'était pas correctement reconnue. Compte tenu de l'échelle du modèle, la maîtrise mathématique nécessaire pour parvenir à ce résultat est véritablement impressionnante. Weibo devrait se dépêcher de publier le code source du travail de Robert !

Fil de karminski-牙医 (@karminski3)

Informations sur l'auteur

Contenu du fil