Franchement, je les vois bien abandonner complètement le DSA et revenir avec un NSA plus précis, ou alors tenter un hybride improbable en passant progressivement des chunks aux K tokens les plus pertinents, et en introduisant tranquillement un nouvel algorithme de pré-entraînement. DPSA, DeepSeek Progressive Sparse Attention. Style baleine
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.