Ayer, @RealJimChanos planteó que el gasto de capital relativamente bajo de Tesla significaba que no eran un competidor serio en el campo de la IA y la robótica en el mundo real. Esta es *exactamente* la forma incorrecta de verlo y, en mi opinión, las implicaciones de este hecho son positivas para Tesla. La inferencia de Tesla se produce, por definición, en el coche, por lo que sus clientes están pagando efectivamente por el "capex" de computación de inferencia, que ahora probablemente representa la mayor parte del gasto de capex de los hiperescaladores. Los gastos de capital de Tesla podrían ser mucho mayores si tuvieran que generar sintéticamente datos de conducción relevantes en un centro de datos. La integración vertical subvencionada por el cliente es magnífica. Esta es también la razón por la que, en algún momento, los clientes de Tesla podrán incorporar sus coches a un grupo de computación perimetral distribuida y obtener ingresos cuando el coche no esté en circulación, del mismo modo que Akamai y Cloudflare están incorporando GPU individuales en sus nodos perimetrales. La flota de Tesla, como la CDN más grande y distribuida del mundo para IA (y solo para IA, ya que obviamente los coches no pueden almacenar contenido en caché), es una posibilidad real. BYD tendrá una oportunidad similar y una ventaja similar en costes de inferencia. Más allá de esta importante ventaja en el coste de inferencia, Tesla cuenta con el segundo clúster Hopper coherente más grande del mundo para el preentrenamiento, solo superado por xAI. Basta con un clúster coherente *siempre que* sea lo suficientemente grande. El tamaño del clúster coherente determina la eficiencia del capital para el preentrenamiento. Nadie ha podido igualar a los clústeres de xAI y Tesla en cuanto a coherencia, velocidad y coste, siendo la coherencia el factor más importante. Por ello, Jensen describió el diseño y la ejecución de su centro de datos como «sobrehumanos». Cabe destacar que Tesla también cuenta con un clúster AI4 para el post-entrenamiento, el entrenamiento en curso o como se le llame actualmente. Tesla también cuenta con una importante ventaja de datos para entrenar modelos FSD óptimos de Chinchilla, ya que el vídeo del mundo real se escala infinitamente y esta ventaja de datos reduce aún más su coste de entrenamiento capitalizado: menor generación de datos sintéticos y menor obtención/etiquetado de datos de terceros en comparación con el entrenamiento de LLM en laboratorios. Esta eficiencia relativa del capital, como resultado de todas estas ventajas (el mayor clúster coherente, clientes que pagan por la inferencia, tamaño del conjunto de datos y costo continuo de generación de datos), probablemente sea importante frente a los competidores de robótica y FSD que son menos eficientes en cuanto al capital. El coste por token lo es todo para la IA. Google es el productor de tokens LLM de bajo coste (seguido por xAI en segundo lugar), pero Tesla es el productor de tokens de menor coste relevantes para la conducción autónoma total y la robótica. En mi trayectoria profesional, la IA representa la primera vez que ser el productor de bajo coste ha tenido relevancia, ya que la cantidad de tokens determina la calidad en un mundo de razonamiento. Creo que el mercado subestima esta dinámica. Es muy posible que Tesla sea superada por un competidor de FSD (algo improbable desde mi punto de vista, pero todo es posible), pero esto no sucederá debido a su relativo gasto de capital. Si la inferencia LLM se produjera en el borde de la red, en teléfonos y PC, como con FSD, el gasto de capital de los hiperescaladores sería *mucho* menor. Este es el verdadero riesgo para el gasto en centros de datos, no solo las consideraciones de valor/macro. Por cierto, la memoria es la principal beneficiada en este escenario, que tardará años en materializarse si las leyes de escalado se mantienen. Jim es un tipo inteligente, pero humildemente creo que sus opiniones sobre IA están mal informadas. También me resulta muy extraño que alguien se centre en la IA como una burbuja, teniendo en cuenta las burbujas cuánticas y nucleares extremadamente obvias, donde hay muchísimas acciones que pueden caer un 99% y seguir estando sobrevaloradas.
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.
