4 Mac Studios connectés via Exo grâce au nouveau système RDMA. Matériel grand public (quoique toujours coûteux), LLM de taille conséquente, 1,5 To de VRAM. Plus de 30 tok/s sur DeepSeek 3.1 (modèle 671B). Un peu cher à utiliser avec Vibecode, mais totyoutube.com/watch?v=x4_RsU…t et personnalisable. https://t.co/aF7zJnuBuA
C’est le genre de choses que les grandes entreprises sont déjà en train d’expérimenter dans leurs laboratoires d’ingénierie logicielle, cherchant à s’affranchir des plateformes d’IA hébergées et contrôlées par un tiers, notamment dans les secteurs où la réglementation empêche la plupart des utilisations de logiciels en nuage. C’est ce type de travail qui facilitera l’adoption des outils d’IA dans ces entreprises, et il devient essentiel pour les éditeurs de logiciels de prendre en compte qu’ils doivent non seulement déployer leur pile logicielle sur site, mais aussi être capables de s’intégrer aux déploiements sur site de leurs clusters d’IA.