Sinceramente, consigo imaginá-los abandonando completamente o DSA e retornando com algum NSA mais refinado, ou fazendo algum híbrido maluco onde eles gradualmente mudam de chunks para top-K tokens, e casualmente introduzem um novo algoritmo de pré-treinamento. DPSA, DeepSeek Progressive Sparse Attention. Estilo baleia.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.