Google TPUv7이 시장을 사로잡았습니다. 핵심 성과 지표가 NVIDIA와 일치합니다. AI 컴퓨팅 성능 환경이 바뀌고 있을까요? @SemiAnalysis_의 기사에서는 Google의 최신 AI 칩인 TPUv7(코드명 Ironwood)에 대한 NVIDIA의 시장 지배력에 대한 기술적 세부 사항, 전략적 중요성, 잠재적 영향에 대한 심층 분석을 제공합니다. 핵심 주장: Google은 더 이상 한 분야에 "부분적으로 특화"하지 않습니다. NVIDIA와 직접 경쟁하고 있습니다. 과거에는 구글의 TPU가 내부적으로 널리 사용되었지만, 단일 칩 성능은 엔비디아의 주력 GPU보다 떨어지는 경우가 많았고, 승리하기 위해서는 수량에 더 의존했습니다. TPUv7은 전환점이 되었으며, 구글은 컴퓨팅 성능, 메모리, 대역폭 측면에서 엔비디아의 최신 플래그십 블랙웰 시리즈와의 격차를 거의 완전히 좁혔습니다. 이제 구글은 하드 사양 측면에서 업계 선두 기업과 직접 경쟁할 수 있는 역량을 갖추게 되었습니다. 하드웨어 사양: "지구상에서 가장 강력한" 사양과 일치 TPUv7과 NVIDIA Blackwell(B200)의 주요 매개변수를 자세히 비교한 결과, 이제 두 제품이 동일한 수준에 있다는 사실이 밝혀졌습니다. • 컴퓨팅 성능: TPUv7의 단일 칩 FP8 컴퓨팅 성능은 약 4.6페타플롭스로, NVIDIA B200의 4.5페타플롭스보다 약간 높습니다. 즉, TPUv7은 AI 모델 학습 및 추론에서 가장 일반적으로 사용되는 연산 작업을 처리할 때에도 약간의 우위를 점합니다. • 메모리 구성: TPUv7은 NVIDIA B200과 동일한 192GB HBM3e 고대역폭 메모리를 탑재했습니다. 메모리 대역폭 또한 7.4TB/s라는 놀라운 수준으로 NVIDIA를 바짝 추격하고 있습니다. 진짜 핵심 기능은 무시무시한 확장 기능입니다. TPUv7의 가장 큰 장점은 개별 칩이 아니라 칩을 서로 연결하는 능력에 있습니다. • 슈퍼클러스터: Google은 독점적인 광 경로 전환 기술과 3D Torus 상호 연결 아키텍처를 사용하여 9,216개의 TPUv7 칩을 거대한 통합 "슈퍼컴퓨팅 사일로"로 연결합니다. • NVIDIA와 비교: NVIDIA의 GB200 NVL72 시스템은 일반적으로 단일 랙에 72개의 GPU를 연결합니다. NVIDIA는 이더넷이나 InfiniBand를 통해 더 많은 랙을 연결할 수 있지만, Google은 단일 대규모 클러스터를 구축하는 데 있어 매우 공격적인 엔지니어링 역량을 보여주었습니다. 이게 무슨 뜻일까요? 수조 개의 매개변수를 가진 대규모 AI 모델을 학습할 때, 이 대규모 저지연 상호 연결은 통신 병목 현상을 크게 줄여 수천 개의 칩이 마치 "거대한 두뇌"처럼 함께 작동할 수 있도록 합니다. 경제적 고려 사항: 경쟁력 있는 소유 비용 SemiAnalysis는 해당 기사에서 수학적으로 분석했습니다. TPUv7의 성능은 NVIDIA와 동일하지만 비용 측면에서 엄청난 이점이 있습니다. Google은 칩 설계, 데이터 센터, 방열부터 네트워크 장비까지 완벽한 수직적 통합 역량을 갖추고 있기 때문에 이 기사에서는 TPUv7 시스템의 총 소유 비용이 NVIDIA GB200 서버 솔루션을 구매하는 것보다 약 44% 낮을 것으로 추정합니다. 이는 컴퓨팅 성능을 구매하기 위해 수십억 달러를 지출해야 하는 기술 거대 기업들에게 거부할 수 없는 유혹입니다. 전략적 전환: "개인용"에서 "무기거래상"으로 이 기사는 또한 Google 비즈니스 모델의 중요한 변화를 강조합니다. 이전에는 TPU가 주로 Google 내부에서 사용되었으며(예: 검색, YouTube, Gemini 모델), 외부 고객은 Google Cloud를 통해서만 대여할 수 있었습니다. 하지만 이제 구글은 외부 고객에게 더욱 유연한 방식으로 컴퓨팅 파워를 제공하고 있으며, Anthropic과 같은 대형 고객사까지 유치하고 있습니다. Anthropic이 대규모 TPU 클러스터를 구매하고 활용하기로 한 것은 구글이 공식적으로 "AI 컴퓨팅 파워 무기 판매상"으로 부상했음을 의미하며, 이전에는 NVIDIA가 점유했던 시장 점유율을 잠식하기 시작했습니다. 이 기사는 TPUv7이 지금까지 구글의 가장 강력한 반격 무기라고 결론지었습니다. NVIDIA와의 하드웨어 사양 차이를 좁힐 뿐만 아니라, 대규모 클러스터 구축 및 비용 관리 측면에서 NVIDIA가 가진 전통적인 강점을 활용하여 독보적인 경쟁 우위를 구축합니다. NVIDIA의 CUDA 생태계가 여전히 탄탄한 반면, Google은 가장 까다로운 AI 모델 학습자에게 성능과 비용 측면에서 매우 경쟁력 있는 대안을 제공합니다. 이는 AI 칩 시장이 NVIDIA의 독점적 지위에서 더욱 치열한 양대 시장으로 이동하고 있음을 시사합니다. 기사 주소:
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
