À titre de comparaison avec mon précédent article sur le MacBook Pro M5 exécutant Gemma 3 QAT 12B avec MLX, voici les performances du M1. Le M1 fonctionne à environ 6 tk/s contre environ 16 tk/s pour le M5.
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.