Le fait qu'ils aient agi ainsi après l'étude de la NSA, qui affirmait que la parcimonie post-entraînement était une impasse, témoigne également de leur capacité à ignorer les coûts irrécupérables. Je me demande ce qu'il est advenu de la NSA. Il est clair que l'attention par blocs est sous-optimale, mais aussi que la DSA n'est qu'une solution provisoire.
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.
