RT @yukangchen_: Nous avons rendu QeRL open-source — Apprentissage par renforcement amélioré par quantification ! 🧠 Entraînement RL quantifié sur 4 bits 💪 Former un LLM 32B sur…
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.