Curiosidade: a previsão de múltiplos tokens do DeepSeek na versão 3 (dezembro de 2024) baseia-se no EAGLE (janeiro de 2024) e cita o MTP da Meta (abril de 2024) como "inspiração". Atualmente, o MTP está se tornando padrão em modelos chineses. O LLaMA 4 da Meta (abr. 2025) não usa MTP (nem quase nada).
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.