fofo e bobo 10B 1.8AB DeepSeek tahuggingface.co/ai-sage/GigaCh…ICvUln Acho que eles podem melhorar a partir disso, assim que conseguirem mais poder computacional e aprimorarem o pós-treinamento. O ajuste fino do NS pelo RN teria sido melhor, e eles até investiram na interpretabilidade dos NS-MoEs. É uma questão de vontade.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.