¡El primer modelo a gran escala de Weibo, el VibeThinker 1.5B, ha sido probado! Aquí tenéis un análisis práctico del nuevo modelo VibeThinker 1.5B publicado en Weibo. La descripción oficial indica que se trata de un modelo con capacidades matemáticas mejoradas. Comencemos con la pregunta clásica: ¿Cuántas 'r' hay en fresa? Esta pregunta es fácil de responder correctamente. Ahora, pasemos al plato fuerte. Pondremos a prueba nuestros conocimientos con un problema matemático: 1. (Examen simulacro de la Alianza de Escuelas Famosas de Zhongyuan 2016) Sea A = {1, 4, 2x}. Si B = {1, x²} y B ⊆ A, entonces x = ? La respuesta a esta pregunta es que x es igual a 0 o -2. ¡Y esta respuesta también era correcta! ¿Es este modelo realmente el comentario de Robert en Weibo? Reiteremos esta cita del comentario: Tengo un problema: me quejo sin razón. El comentario original de Robert fue: "Yo también, podemos quejarnos juntos". El modelo respondió a diálogos bastante absurdos. De hecho, esto es bastante normal para un modelo de escala 1.500 millones como el médico del equipo. Estos modelos a pequeña escala suelen estar especializados en una habilidad concreta y, sin el entrenamiento adecuado ni el soporte de parámetros, pueden dar fácilmente respuestas sin sentido a diálogos normales. Sin embargo, al desplazarme hacia arriba, sentí que había un problema con el tokenizador; la entrada no se reconocía correctamente. Considerando la escala del modelo, la capacidad matemática para lograr este resultado es realmente impresionante. ¡Weibo debería darse prisa y publicar el trabajo de Robert como código abierto!
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.