“Só que isso simplesmente não é verdade” Percebo que pessoas sem formação técnica têm dificuldade em entender esse ponto sobre a dependência da China em relação ao CUDA. Então, vou explicar aqui. Não se pode criar um ecossistema por decreto e subsídio. Esse é um problema real, mesmo em uma "economia planificada", e é por isso que a China rejeitou os H20 e se mostra tão indiferente até mesmo aos H200. Você precisa de pessoas, muitas e muitas pessoas talentosas, para usar seus chips, seus servidores, seus frameworks, suas APIs, toda a sua arquitetura, para resolver problemas de ponta, fornecer feedback e contribuir. Via de regra, pessoas talentosas têm coisas interessantes para fazer, e geralmente não é "consertar uma plataforma ngmi". O efeito de superestrela é muito significativo, as curvas de aprendizado são implacáveis. A AMD ainda está lutando! A Huawei pode produzir silício de boa qualidade (em teoria). Mas se as únicas pessoas treinando no Ascends forem a Huawei e a iFlyTek, esse silício não chegará a lugar nenhum, porque a Huawei e a iFlyTek claramente não têm ideia de como treinar modelos de ponta. Veja bem, todo mundo gosta da citação de Wenfeng sobre a falta de chips, mas o principal fator limitante na "corrida da IA" ainda não é a capacidade computacional, mas sim o TALENTO, tanto em P&D quanto em gestão. A capacidade computacional é o fator limitante *especificamente para a DeepSeek* porque eles são gênios, sem ironia, monstros do nível Gold da IOI. Eles têm todo o talento necessário, só lhes faltam GPUs para executar sua visão. Por outro lado, a capacidade computacional NÃO é o fator limitante para gigantes como Meta, Microsoft e Amazon, como se pode deduzir pelo fato de criarem modelos de qualidade inferior, apesar de terem uma vantagem computacional de 1000 vezes ou mais sobre a DeepSeek. A maioria dos laboratórios que reclamam da sua fome por poder computacional e brincam sobre "hnngh, eu quero GPUs, brrr", apesar da gritante incapacidade de igualar uma V3 madura com muito mais do que 2048 H800s, estão apenas tentando salvar as aparências. Eles não estão limitados por FLOPS, mas sim por falta de habilidades. Assim será no final de 2025, no fim da era da escalabilidade às cegas, conforme anunciado por Ilya e seus seguidores. Hora de atualizar suas expectativas. Por coincidência, pelo menos dois dos engenheiros da DeepSeek que conheço são ex-estagiários da Nvidia. Em que você acha que eles preferem trabalhar? Na medida em que a China tem acesso constante aos chips da Nvidia, isso desacelera direta e drasticamente o desenvolvimento de suas tecnologias soberanas, porque aproximadamente 100% dos seus melhores talentos irão para laboratórios que usam Nvidia, para trabalhar sem dificuldades em suas pesquisas de ponta e entregar resultados de classe mundial, em vez de depurar o CANN-ONNX com um estagiário sonolento da Huawei. Simples assim. Eles não são uma sociedade maoísta; não podem simplesmente mandar um autista orgulhoso com 3500 pontos no CodeForces, um artista de anime com um artigo de destaque na NeurIPS, para se meter com a CANN. Ele simplesmente vai embora, seja para um laboratório mais sensato ou direto para os EUA. Isso acontece há muito tempo, e é isso que motiva Xi a impor restrições e inconvenientes à aquisição do H200 – ele quer que aqueles que ficarem não tenham escolha a não ser ajudar os fabricantes de chips nacionais. Você pode achar essa política errada por discordar dos prazos e da trajetória da Inteligência Artificial Geral (IAG). Tudo bem. Mas essa é a política chinesa. Huawei, Cambricon e outras empresas estão sendo duramente prejudicadas pela Nvidia. Some a isso a AMD, que parece finalmente ter se dado conta de que não está usando a cabeça, e temos um ataque direto à capacidade delas de desenvolver uma alternativa às arquiteturas americanas em uma década. Em ambos os casos, estou relativamente otimista quanto aos resultados para a China. Eles vão dar um jeito. Meu ponto é simplesmente motivado pela irritação com esse mal-entendido grosseiro e arrogante. Não, querida, fisgá-los na sua base de clientes tem valor. Faça o que quiser com essa informação.
O que @TheZvi, “superprevisores” como @peterwildeford e seus semelhantes acham que a vantagem da Nvidia é: ooooh, quanta interconexão, tantos fracassos, uau, sugoi desu ne, Ascend jamais conseguiria. Qual é, de fato, a vantagem da Nvidia:
@TheZvi @peterwildeford (o 3FS não é sobre a Nvidia especificamente, claro, quero dizer a vibe de "parecer um idiota")



