Ontem, @RealJimChanos afirmou que o investimento de capital relativamente baixo da Tesla significava que ela não era uma concorrente séria em inteligência artificial e robótica no mundo real. Essa é *exatamente* a maneira errada de encarar a situação, e as implicações desse fato são, na verdade, positivas para a Tesla, na minha opinião. A inferência da Tesla ocorre, por definição, dentro do carro, portanto, seus clientes estão efetivamente pagando pelo "capex" de computação de inferência, que provavelmente representa a maior parte dos gastos de capital dos hiperescaladores atualmente. O investimento de capital da Tesla poderia ser uma ordem de magnitude maior se eles tivessem que gerar dados de condução relevantes sinteticamente em um centro de dados. A integração vertical subsidiada pelo cliente é belíssima. É por isso também que, em algum momento, os clientes da Tesla poderão colocar seus carros em um conjunto de computação de borda distribuída e ganhar dinheiro quando o carro não estiver em uso — da mesma forma que a Akamai e a Cloudflare estão colocando GPUs individuais em seus nós de borda. A frota da Tesla como a maior e mais distribuída CDN do mundo para IA (e somente IA, já que obviamente não é possível armazenar conteúdo em cache em carros) é uma possibilidade real. A BYD terá uma oportunidade semelhante e uma vantagem similar em termos de custo de inferência. Além dessa significativa vantagem em custos de inferência, a Tesla possui o segundo maior cluster Hopper coerente do mundo para pré-treinamento, atrás apenas do xAI. Você só precisa de um cluster coerente *se* ele for grande o suficiente. O tamanho do cluster coerente impulsiona a eficiência de capital para o pré-treinamento. Ninguém conseguiu igualar os clusters da xAI e da Tesla em termos de coerência, velocidade e custo, sendo a coerência o fator mais importante. É por isso que Jensen descreveu o design e a execução do data center deles como "sobre-humanos". Vale ressaltar que a Tesla também possui um cluster AI4 para pós-treinamento, treinamento intermediário ou qualquer outro termo que usemos atualmente. A Tesla também possui uma vantagem significativa em termos de dados para o treinamento de modelos FSD otimizados pelo Chinchilla, já que o vídeo do mundo real é infinitamente escalável, e essa vantagem reduz ainda mais o custo de treinamento — menos geração de dados sintéticos e menos busca/rotulagem de dados de terceiros em comparação com o treinamento de LLMs em laboratório. Essa relativa eficiência de capital, resultante de todas essas vantagens — o maior cluster coerente, clientes pagando pela inferência, tamanho do conjunto de dados e custo contínuo de geração de dados — provavelmente será um diferencial em relação aos concorrentes de Robótica e FSD, que são menos eficientes em termos de capital. O custo por token é crucial para a IA. O Google é o produtor de tokens LLM de menor custo (com o xAI em segundo lugar), mas a Tesla é a produtora de tokens de menor custo que realmente importam para a direção autônoma completa (FSD) e a robótica. Na minha carreira, a IA representa a primeira vez em que ser o produtor de menor custo fez diferença, já que a quantidade de unidades efetivamente impulsiona a qualidade em um mundo de raciocínio. Acredito que essa dinâmica seja muito subestimada pelo mercado. É bem possível que a Tesla seja superada pela concorrência de um concorrente com FSD (Full Self-Driving) — improvável do meu ponto de vista, mas tudo é possível —, mas isso não acontecerá devido ao seu investimento de capital relativamente baixo. Se a inferência LLM ocorresse na borda da rede em celulares e PCs, como acontece com o FSD, o investimento em infraestrutura de hiperescala seria *muito* menor. Esse é o verdadeiro risco para os gastos com data centers, e não apenas o valor agregado/macroeconomia. Aliás, a memória é a grande beneficiada nesse cenário, que ainda levará anos para se concretizar, caso as leis de escalabilidade continuem válidas. Jim é um cara inteligente, mas, humildemente, acho que suas opiniões sobre IA são equivocadas. Também me parece muito estranho que alguém esteja focado na IA como uma bolha, considerando as bolhas quânticas e nucleares extremamente óbvias, onde há muitas ações que podem cair 99% e ainda assim estarem sobrevalorizadas.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.
