J'utilise le nouveau MacBook Pro M5 depuis sa sortie et c'est une bête de course, surtout comparé à mon ancien M1 ! C'est idéal pour exécuter localement de petits modèles d'IA, mais en plus, tout ce que vous faites est tellement rapide. Voici Gemma 3 QAT 12B fonctionnant avec MLX :
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.