RT @ShengyuanS : Salut Dzmitry, notre QAT INT4 utilise uniquement les poids avec une fausse quantification : nous conservons les poids BF16 d'origine en mémoire, pendant…
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.