Effet secondaire du blocage de l'achat des meilleures cartes NVIDIA par les entreprises chinoises : les modèles haut de gamme sont désormais explicitement conçus pour fonctionner correctement sur des GPU plus anciens/moins chers. Le nouveau modèle SoTA de @Kimi_Moonshot utilise les opérations classiques de BF16 (après déquantification à partir d'INT4) ; pas besoin de support FP4 coûteux.
C'est une excellente nouvelle pour nous tous. Cela signifie un accès moins coûteux aux meilleurs modèles disponibles pour tous. 非常感谢 @Kimi_Moonshot ! :D
