RT @ShikaiQiu : En combinant µP avec une décroissance du poids indépendante de la largeur (1/largeur), nous constatons que Muon et Shampoo permettent tous deux d’obtenir des gains de calcul constants de 1,4x et 1,3x…
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.