RT @WentaoGuo7: 🚀SonicMoE🚀: uma implementação MoE extremamente rápida, otimizada para GPUs NVIDIA Hopper. O SonicMoE reduz a memória de ativação em 45%...
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.