Na série, a escala é importante: o modelo de 600m, ainda não lançado, me surpreendeu ainda mais como base para modelos especializados.
Avaliações comparáveis às do Qwen 3 600m, mas com a grande vantagem de não estar sobrecarregado com tokens 36T: muito mais espaço para ajustar as probabilidades dos tokens.