Novo vídeo lançado – Modelo compacto, alto desempenho! Teste prático do modelo Nemotron 3 Nano de código aberto da NVIDIA. Neste vídeo, vou apresentar rapidamente o relatório técnico e demonstrar alguns testes práticos. No vídeo você verá: - Configuração principal do Nemotron 3 Nano: escala de parâmetros, arquitetura MoE + Mamba Transformer, contexto de 1M - Dados de pré-treinamento 25T, processo de treinamento em duas etapas: aprendizado do curso + SFT + RLVR + RLHF - Abordagem oficial de quantização: De BF16 a FP8, como maximizar a preservação da pontuação por meio da quantização seletiva. - Nano VS Qwen3 Próxima Tarefa do Mundo Real: Programação + Escrita
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.
