A versão sem slots do Qwen3-Next-80B-A3B, gguf, foi finalmente lançada! Este modelo pode finalmente ser usado localmente sem problemas. Meu SSD M.2 Ultra de 128 GB agora funciona em 6 bits com muita fluidez. Agora estamos apenas aguardando o lançamento do próximo modelo de arquitetura em larga escala no final do ano. O Next usa atenção controlada (gateed attention), que ganhou o prêmio de melhor artigo no NeurIPS deste ano, então espera-se que o novo modelo de arquitetura em larga escala no final do ano tenha um bom desempenho. E seria ótimo se também houvesse um modelo de tamanho médio, em torno de 70 a 80 bytes, disponível para uso local, haha. endereço:
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.
