¡Xiaohongshu acaba de lanzar un nuevo modelo, el RedOne 2.0! El modelo incluye dos versiones: RedOne 2.0-4B y RedOne 2.0-30B-A3B. ¿Mmm? Este tamaño me resulta familiar. ¡Claro! Es una Qwen3 modificada. La principal ventaja de estos dos modelos es que han superado la prueba de referencia SNS-Bench. Como su nombre indica, SNS-Bench es una prueba de contenido para redes sociales que examina principalmente la categorización de notas, la relevancia del contenido de las consultas y la generación de palabras clave en los comentarios. Por ejemplo, genere una posible consulta para la siguiente publicación: ``` El tipo de nota de entrada es: Nota de vídeo. Título: Aprende a asar durián en un minuto: ¡Súper delicioso, pruébalo ahora! Etiquetas de categoría multinivel: Comida/Tutoriales de cocina/Tutoriales de recetas. Contenido principal: /Durián asado [Tema]/Comida en freidora de aire [Tema]/ Información OCR de la imagen de portada: Durian asado casero. Comentarios populares: Autor, ¿dónde vive? [emoji de risa y llanto] ``` La respuesta es: ¿Cuánto tiempo se tarda en cocinar un durian crudo en una freidora de aire? (También se aceptan otras preguntas relacionadas). Un pequeño apunte: SNS-Bench parece ser un proyecto chino; le he dado un total de 3 estrellas, incluyendo la que acabo de otorgar. El corpus parece estar traducido del chino al inglés, por lo que no es un corpus nativo. Incluso vi contenido de series de televisión chinas traducido al inglés, lo que podría causar problemas a la hora de que el modelo comprenda el contenido. Además, ¿parece que estos dos modelos no tienen pesos disponibles? Busqué pero no encontré ningún enlace de descarga.
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.
