Opinião: grande parte da circularidade no gráfico Nvidia/Coreweave/OpenAI pode ser explicada pela falta de viabilidade financeira dos data centers de IA. Para entender o porquê, podemos analisar o modelo de negócios da mineração de criptomoedas: à medida que a dificuldade aumentava, muitas empresas de mineração de criptomoedas se tornaram deficitárias devido aos enormes custos de depreciação que, essencialmente, eliminavam o lucro líquido a cada poucos anos com a substituição dos equipamentos. Os data centers de IA são praticamente uma repetição disso da perspectiva dos provedores de data centers, já que eles só lucram com o tempo de uso da GPU e não com os resultados reais da IA; portanto, o conteúdo da computação é irrelevante para o modelo de negócios. A Nvidia, o Google e a OpenAI estão terceirizando total ou parcialmente a gestão de seus data centers, pois os custos de depreciação representam um prejuízo enorme para qualquer balanço patrimonial. Para as novas nuvens, é mais fácil absorver esse custo e se beneficiar de ambas as fases do ciclo de vida do hardware, sem precisar arcar com a depreciação em si. Quando a Nvidia vende GPUs para a CW e aluga horas de GPU de volta para a DGX Cloud, o que ela está fazendo na verdade é lucrar com a venda da GPU e com a margem de lucro do aluguel, fazendo com que a CW arque com a depreciação. As empresas de computação em nuvem estão no negócio visando a valorização das ações e o crescimento repentino. Isso funcionará por algum tempo, até que elas não consigam mais obter financiamento por meio de dívidas. Nesse ponto, muitas finanças precisarão ser recalibradas, caso os grandes players precisem assumir integralmente a desvalorização. Por razões relacionadas à cadeia de suprimentos e recursos, os custos dos chips de GPU NÃO são custos que diminuirão com o tempo por unidade, pois esperamos que novas gerações de GPUs com maior capacidade continuem a substituir o hardware antigo a preços iguais ou superiores, e as cargas de computação LLM continuarão a ficar maiores e mais complexas. Portanto, não há como reverter esse modelo para torná-lo lucrativo; é uma bomba-relógio que será detonada por mudanças nas taxas de juros ou problemas de liquidez (ou ambos). A única maneira de fazer as coisas funcionarem é melhorar a eficiência no paradigma da IA, o que nos permitirá obter a mesma economia de data center que a nuvem convencional: ser capaz de executar computação por meio de hardware mais econômico, onde a depreciação não seja tão extrema. Num futuro próximo, isso poderá se traduzir em hardware mais econômico, com menor concentração na cadeia de suprimentos, para uma arquitetura de IA fundamentalmente diferente, onde obtemos o mesmo ou melhor desempenho de inferência em hardware mais fácil e amplamente fabricado. Se/quando a bolha estourar, provavelmente será a melhor coisa para a indústria de IA a longo prazo, pois começará a redistribuir o financiamento para abordagens melhores do que "simplesmente aumentar o tamanho, gastar mais dinheiro e ver o que acontece".
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.