[차용호 반도체/소부장] 구글 모멘트, AI경쟁 재개 촉매제로 작용할 것
구글 모멘트 작동
Gemini 3.0 출시 이후 호평가에 이어 구글의 TPU 외부 판매 확대 보도가 이루어지며 연일 구글 Value Chain 강세와 엔비디아 Value Chain의 약세가 이루어지고 있다. TPU가 다른 빅테크 업체들의 ASIC 대비 높은 평가를 받는 주요 요인은 구글이 엔비디아와 같이 AI Value Chain에 대한 Full Stack 접근을 하고 있기 때문이다. 엔비디아와 구글의 기술 구도는 Chip(GPU vs TPU), Scale-up(NVLink vs 3D Torus), Scale-Out(InfiniBand/Spectrum-x vs OCS - Optical Circuit Switching), SW(CUDA 기반 Pytorch vs XLA 기반 Tensorflow/Jax)로 대비할 수 있다. 특히, 엔비디아의 진정한 해자가 GPU와 CUDA의 설계 최적화로 나타나듯, 구글은 TPU와 자사 프레임워크인 Tensorflow/Jax와의 최적화 성능이 뛰어나다.
TPU의 확장성을 위해 가장 중요한 것은 결국 SW
구글의 TPU의 외부 서비스 중 앞서 보도된 앤트로픽향 공급은 클라우드 컴퓨팅 기반이었지만, 작일 보도된 Meta향 공급은 온 프레미스(On-Premise)로 알려지며 엔비디아의 경쟁 구도가 더욱 부각되었다. 구글의 TPU가 추론용 및 자사 SW 훈련용 이상의 확장성을 갖추고 엔비디아와의 직접 경쟁을 위한 가장 중요한 요인은 SW로 판단된다. 현재 AI 프레임워크 내 점유율은 구글이 주로 활용하는 자체 프레임워크 Tensorflow/Jax 대비 Meta에서 시작된 Pytorch가 우위를 보이고 있다. 이때, 구글이 Pytorch 시장을 공략할 수 있는 방법은 두 가지가 존재한다.
① Tensorflow/Jax→Pytorch 전환 기능 향상: 현재 Tensorflow/Jax→Pytorch 전환 기능을 제공하고 있지만 아직 성능이 수월하지 않은 것으로 파악되며, 전환 비용이 발생한다는 단점이 존재한다.
② TPU의 Pytorch 최적화: Pytorch에 최적화하기 위해서는 시간과 자원이 소요될 것이며, 기존 구글 TPU의 장점이었던 TPU와 Tensorflow/Jax 간의 시너지 효과가 사라진다.
따라서 구글의 TPU 확대를 위해서는 Pytorch와의 호환보다는 Tensorflow/Jax에 대한 개발자 유입이 필요하며, 이는 SW와 문화의 영역인만큼 오랜 시간이 소요될 것이다.
구글 모멘트, AI경쟁 재개 촉매제로 작용할 것
Gemini와 TPU의 점유율은 이제 막 OpenAI와 엔비디아를 대체하기 시작한 것이며, 아직 구글을 AI산업의 승자로 평가하기에는 이르다. TPU 판매 확대를 위해서는 SW를 제외하더라도 고객사가 LLM 선두 업체로 평가받는 구글에게 내부 전략을 공유하는 고객사와의 경쟁구도도 고려해봐야한다. 또한 AI 산업에서 LLM 이후의 확장을 위해 구글이 보유한 AI Device인 Pixel 폰과 Waymo는 경쟁사 대비 부진한 상황이다.
결국 구글 모멘트는 AI산업의 경쟁 재개 촉매제로 작용할 것으로 전망한다. 금번 사건을 통해 경쟁사들은 경각심을 가지고 최근 AI버블로 인해 위축되었던 AI투자 심리를 다시 회복하는 계기가 될 것이기 때문이다. 국내 메모리 산업에도 긍정적인 요인으로 판단한다. 결국 HBM 공급업체는 3곳으로 한정되어 있으며, 구글 TPU의 점유율 확대는 압도적이었던 엔비디아에게 집중된 HBM 수요가 다변화되며 공급업체의 협상력 우위로 작용할 것이다. 또한 구글의 TPU가 추론 영역을 넘어서 엔비디아와 견줄 범용성과 성능을 갖추기 위해서는 결국 Chip과 HBM의 스펙 업그레이드가 동반되어야 할 것이기 때문이다.
URL: https://buly.kr/2fekkIg