A Xiaohongshu acaba de lançar um novo modelo, o RedOne 2.0! O modelo inclui duas versões: RedOne 2.0-4B e RedOne 2.0-30B-A3B. Hum? Esse tamanho me parece familiar. Isso mesmo, é um Qwen3 modificado. A maior vantagem desses dois modelos é que eles ficaram em primeiro lugar no benchmark SNS-Bench. Como o nome sugere, o SNS-Bench é um teste de conteúdo de mídia social que examina principalmente a categorização de notas, a relevância do conteúdo da consulta e a geração de palavras-chave em comentários. Por exemplo, gere uma possível consulta para a seguinte postagem: ``` Tipo de nota de entrada: Nota em vídeo Título: Aprenda a assar durião em um minuto - Super delicioso, experimente agora! Tags de categoria multinível: Comida/Tutoriais de culinária/Tutoriais de receitas Conteúdo principal: /Durião assado [Tópico]/Comida na Air Fryer [Tópico]/ Informações de OCR da imagem da capa: Durian assado caseiro. Comentários populares: Autor, onde você mora? [emoji de riso e choro] ``` A resposta é: Quanto tempo leva para cozinhar um durião cru em uma fritadeira elétrica sem óleo? (Outras perguntas relacionadas também são aceitáveis.) Apenas um detalhe: o SNS-Bench parece ser um projeto chinês; tenho um total de 3 estrelas, incluindo a que acabei de dar. O corpus parece ter sido traduzido do chinês para o inglês, então não é um corpus nativo. Cheguei a ver conteúdo de séries de TV chinesas traduzido para o inglês, o que pode causar problemas para a compreensão do conteúdo pelo modelo. Além disso, parece que esses dois modelos não têm pesos disponíveis? Procurei, mas não encontrei um link para download.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.
