Google TPUv7 arrasa en el mercado: los indicadores clave de rendimiento coinciden con los de NVIDIA, ¿está a punto de cambiar el panorama de la potencia informática de la IA? Un artículo de @SemiAnalysis_ proporciona un análisis en profundidad de los detalles técnicos, la importancia estratégica y el impacto potencial en el dominio del mercado de NVIDIA del último chip de inteligencia artificial de Google, TPUv7 (nombre en código Ironwood). Argumento clave: Google ya no se “especializa parcialmente” en un área; se enfrenta directamente a NVIDIA. En el pasado, aunque las TPU de Google se usaban ampliamente a nivel interno, su rendimiento de un solo chip a menudo era inferior al de las GPU insignia de NVIDIA, y dependían más de la cantidad para ganar. TPUv7 marcó un punto de inflexión, ya que Google prácticamente cerró la brecha con la última serie insignia de NVIDIA, Blackwell, en potencia de procesamiento, memoria y ancho de banda. Google ahora tenía la fuerza para competir directamente con el líder de la industria en cuanto a especificaciones estrictas. Especificaciones de hardware: A la altura de lo "más potente del planeta" Una comparación detallada de los parámetros clave de TPUv7 y NVIDIA Blackwell (B200) reveló que ahora están en la misma clase: Rendimiento computacional: La potencia computacional FP8 de un solo chip del TPUv7 es de aproximadamente 4,6 petaflops, ligeramente superior a los 4,5 petaflops del NVIDIA B200. Esto significa que el TPUv7 incluso presenta una ligera ventaja al gestionar las tareas computacionales más comunes en el entrenamiento e inferencia de modelos de IA. Configuración de memoria: La TPUv7 está equipada con 192 GB de memoria HBM3e de alto ancho de banda, exactamente igual que la NVIDIA B200. El ancho de banda de la memoria también alcanza un impresionante nivel de 7,4 TB/s, muy por debajo de NVIDIA. La característica verdaderamente destacada: aterradoras capacidades de ampliación. La mayor ventaja de TPUv7 no está en los chips individuales, sino en su capacidad de conectarlos entre sí. • Supercúmulo: Google utiliza su tecnología patentada de conmutación de trayectoria óptica y la arquitectura de interconexión 3D Torus para conectar 9.216 chips TPUv7 en un “silo de supercomputación” enorme y unificado. En comparación con NVIDIA: el sistema NVL72 GB200 de NVIDIA suele conectar 72 GPU en un solo rack. Si bien NVIDIA también podría conectar más racks mediante Ethernet o InfiniBand, Google ha demostrado una capacidad de ingeniería extremadamente avanzada al construir un único clúster a gran escala. ¿Qué significa esto? Para entrenar modelos masivos de IA con billones de parámetros, esta interconexión a gran escala y de baja latencia puede reducir significativamente los cuellos de botella en la comunicación, permitiendo que miles de chips funcionen juntos como un "cerebro gigante". Consideraciones económicas: costos de propiedad altamente competitivos SemiAnalysis hizo los cálculos en el artículo: aunque el rendimiento de TPUv7 está a la par con NVIDIA, tiene una enorme ventaja de costo. Debido a que Google tiene capacidades completas de integración vertical desde el diseño de chips, centros de datos y disipación de calor hasta equipos de red, el artículo estima que el costo total de propiedad del sistema TPUv7 es aproximadamente un 44 % menor que el de comprar una solución de servidor NVIDIA GB200. Esta es una tentación irresistible para los gigantes tecnológicos que necesitan gastar miles de millones de dólares para comprar poder de cómputo. Cambio estratégico: del "uso personal" al "traficante de armas" El artículo también destaca un cambio significativo en el modelo de negocio de Google. Anteriormente, las TPU se utilizaban principalmente internamente en Google (como para búsquedas, YouTube y el modelo Gemini), y los clientes externos solo podían alquilarlas a través de Google Cloud. Pero ahora, Google ofrece potencia informática a clientes externos de forma más flexible, atrayendo incluso a grandes clientes como Anthropic. El compromiso de Anthropic con la compra y el uso de clústeres de TPU a gran escala marca el surgimiento oficial de Google como "proveedor de potencia informática de IA", comenzando a arrebatarle cuota de mercado que antes pertenecía a NVIDIA. El artículo concluye que TPUv7 es el arma de contraataque más poderosa de Google hasta la fecha. No solo cierra la brecha generacional con NVIDIA en cuanto a especificaciones de hardware, sino que también aprovecha sus ventajas tradicionales en la construcción de clústeres a gran escala y el control de costos para construir una ventaja competitiva única. Si bien el ecosistema CUDA de NVIDIA se mantiene sólido, Google ofrece una alternativa altamente competitiva tanto en rendimiento como en costo para los entrenadores de modelos de IA más exigentes. Esto podría indicar que el mercado de chips de IA está pasando del dominio de NVIDIA a un duopolio más intenso. Dirección del artículo:
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.
