« Sauf que cela est tout simplement faux. » Je constate que les personnes non initiées ont du mal à comprendre ce point concernant la dépendance de la Chine à l'égard de CUDA. Je vais donc l'expliquer. On ne peut pas créer un écosystème par décret et subventions. C'est un véritable problème, même dans une économie planifiée, et c'est pourquoi la Chine a rejeté les H20 et se montre si tiède envers les H200. Il faut des personnes, beaucoup de personnes talentueuses, pour utiliser vos puces, vos serveurs, vos frameworks, vos API, toute votre architecture, afin de résoudre des problèmes de pointe, de vous faire part de leurs retours et de contribuer. En règle générale, les personnes talentueuses ont des projets intéressants, et il ne s'agit généralement pas de « corriger une plateforme ngmi ». L'effet « superstar » est très important, la courbe d'apprentissage est impitoyable. AMD est toujours en difficulté ! Huawei peut fabriquer de bonnes puces (en théorie). Mais si les seuls à s'entraîner sur Ascends sont Huawei et IFlyTek, ces puces n'iront nulle part, car Huawei et IFlyTek sont manifestement ignorants en matière d'entraînement de modèles de pointe. Vous savez, tout le monde apprécie la citation de Wenfeng sur le manque de puces, mais le principal facteur limitant dans la « course à l'IA » reste le TALENT, tant en R&D qu'en management, et non la puissance de calcul. Le calcul est le facteur limitant *pour DeepSeek en particulier*, car ce sont des génies, sans ironie aucune, des monstres de niveau IOI Gold. Ils ont tout le talent nécessaire ; il ne leur manque que les GPU pour concrétiser leur vision. À l'inverse, le calcul n'est PAS le facteur limitant pour des géants comme Meta, Microsoft et Amazon, comme en témoignent leurs modèles de piètre qualité, malgré une puissance de calcul 1 000 fois supérieure à celle de DeepSeek. La plupart des laboratoires qui se plaignent de leur manque de puissance de calcul et plaisantent en disant « hnngh, je veux des GPU qui vrombissent », malgré leur incapacité flagrante à égaler une V3 mature avec bien plus de 2 048 H800, cherchent à sauver la face. Leur goulot d'étranglement n'est pas le FLOPS, mais le manque de compétences. Voilà où nous en sommes fin 2025, à la fin de l'ère de la mise à l'échelle aveugle, comme l'ont annoncé Ilya et ses fidèles. Il est temps de revoir vos hypothèses. Au moins deux ingénieurs de DeepSeek que je connais sont d'anciens stagiaires chez Nvidia. À votre avis, sur quoi préfèrent-ils travailler ? Dans la mesure où la Chine bénéficie d'un accès constant aux puces Nvidia, cela ralentit considérablement le développement de ses technologies nationales, car la quasi-totalité de ses meilleurs talents iront travailler dans des laboratoires équipés de puces Nvidia, afin de mener à bien leurs recherches de pointe et d'obtenir des résultats exceptionnels, plutôt que de déboguer CANN-ONNX avec un stagiaire Huawei peu motivé. C'est aussi simple que ça. Ce n'est pas une société maoïste ; ils ne peuvent pas dire à un génie arrogant, auteur d'un article de NeurIPS et ayant 3 500 mots de passe sur CodeForces, d'aller foutre le bordel avec CANN. Il partira tout simplement, soit dans un labo plus sérieux, soit carrément aux États-Unis. Ça dure depuis toujours, et c'est ce qui motive Xi à imposer des restrictions et des contraintes aux achats H200 : il veut que ceux qui restent n'aient d'autre choix que d'aider les fabricants de puces nationaux. Vous pouvez trouver cette politique erronée en raison d'un désaccord sur le calendrier et la trajectoire de l'IA générale. Soit. Mais c'est la politique chinoise. Huawei, Cambricon et d'autres sont fortement pénalisés par Nvidia. Ajoutez à cela AMD, qui semble enfin avoir compris, et c'est une attaque frontale contre leur capacité à développer une alternative aux architectures américaines d'ici une décennie. Je suis plutôt optimiste quant à l'issue pour la Chine dans les deux cas. Ils trouveront une solution. Mon propos est simplement motivé par mon irritation face à ce malentendu grossier et suffisant. Et puis, les fidéliser a de l'importance. Faites-en ce que vous voulez.
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.


