Sinceramente, creo que abandonarán por completo el DSA y volverán con un NSA más preciso, o implementarán una combinación alocada donde gradualmente cambiarán de fragmentos a tokens top-K e introducirán casualmente un nuevo algoritmo de preentrenamiento. DPSA, DeepSeek Progressive Sparse Attention. Estilo ballena.
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.