Qwen continua vencendo por treinar em *todos* os conjuntos de teste possíveis, incluindo os futuros. A Frontier Labs, por sua vez, treina apenas em conjuntos de teste antigos.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.
