O primeiro modelo em larga escala do Weibo, o VibeThinker 1.5B, foi testado! Aqui está uma análise prática do recém-lançado modelo VibeThinker 1.5B no Weibo. A descrição oficial diz que é um modelo com capacidades matemáticas aprimoradas. Vamos começar com a pergunta clássica: Quantos 'r's há em "strawberry" (morango)? Esta pergunta é fácil de responder corretamente. Agora, vamos ao que interessa. Testaremos nossos conhecimentos com um problema de matemática: 1. (Simulado da Aliança de Escolas Famosas de Zhongyuan de 2016) Seja A = {1, 4, 2x}. Se B = {1, x²} e B ⊆ A, então x = ? A resposta para essa pergunta é que x é igual a 0 ou -2. E essa resposta também estava correta! Então, esse modelo é mesmo o comentário do Robert no Weibo? Vamos reiterar esta citação do comentário: Eu tenho um problema: eu reclamo sem motivo. O comentário original de Robert foi: "Eu também, podemos lamentar juntos." O modelo respondeu a alguns diálogos bastante absurdos. Na verdade, isso é bem normal para um modelo de escala 1,5B como o médico da equipe. Esses modelos de pequena escala geralmente são especializados em uma determinada habilidade e, sem treinamento adequado ou suporte de parâmetros, podem facilmente dar respostas sem sentido a diálogos normais. No entanto, ao rolar para o topo da página, percebi que havia um problema com o analisador léxico; a entrada não estava sendo reconhecida corretamente. Considerando a escala do modelo, a capacidade matemática para alcançar esse resultado é realmente impressionante. O Weibo deveria se apressar e disponibilizar o trabalho de Robert como código aberto!
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.