RT @WentaoGuo7 : 🚀SonicMoE🚀 : une implémentation MoE ultra-rapide optimisée pour les GPU NVIDIA Hopper. SonicMoE réduit la mémoire d'activation de 45 %…
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.