Googleが仕掛ける「100万チップ」の賭け NVIDIA包囲網の切り札「Ironwood」は推論時代の覇者になれるか / 12/3(水) / AMP[アンプ]
Anthropic「100万チップ契約」の衝撃――数百億ドルがGoogleに流れた理由
ChatGPTの最大の対抗馬と目される「Claude」。そのClaudeを開発するAI企業Anthropic(アンソロピック)が2025年10月、Google Cloudと「最大100万個のチップにアクセスする契約」を締結した。AI業界最大級のインフラ投資として注目を集めている。
契約金額は「数百億ドル(数兆円)規模」とされており、2026年には「1ギガワット超」の計算能力がオンライン化する見込みだ。1ギガワットといえば、約100万世帯分の電力消費に相当する途方もないスケールである。この契約でAnthropicは、Googleの第7世代TPUチップ「Ironwood」最大100万個の使用権を獲得した。
この規模のチップ群を一企業が確保する例は前代未聞。業界では1万から5万個のチップ集積でも「巨大クラスター」と呼ばれるのが現状だ。なぜAnthropicはこれほどの投資に踏み切ったのか。同社のクリシュナ・ラオ 最高財務責任者は「当社の顧客は大企業からAIネイティブなスタートアップまで幅広く、最も重要な業務にClaudeを活用している。指数関数的に増大する需要に応え、モデルを業界最先端に保つには、この拡張された計算能力が不可欠だ」と説明する。
実際、Anthropicの大口顧客数は過去1年で約7倍に増加しており、現在は30万社を超える企業顧客を抱えている。この契約でGoogleが「二重の利益」を得る構造になっている点も見逃せない。GoogleはすでにAnthropicに出資しており、今回のクラウド契約で巨額の売上も確保できるからだ。
第7世代TPU「Ironwood」の実力――性能4倍、NVIDIA Blackwellに真っ向勝負
では、Anthropicが巨額を投じて確保した「Ironwood」とは、どのようなチップなのか。Googleが2025年11月に一般提供を開始した第7世代TPU「Ironwood」は、前世代のTrillium(第6世代)と比較して、訓練と推論の両ワークロードで4倍以上の性能向上を実現した。
第5世代との比較では実に10倍の性能改善を達成しており、Google史上最強かつ最もエネルギー効率の高いカスタムチップだ。単体チップの計算能力は、FP8精度で4614TFLOPSに達する。これはNVIDIAの最新GB200(4856TFLOPS)に迫る水準であり、前世代H100(1979TFLOPS)の2倍以上の性能を実現している。
だが、Ironwoodの真価は単体性能だけではない。特筆されるのは、Googleが独自開発した高速接続技術「Inter-Chip Interconnect」により、最大9,216個のチップを単一の「スーパーポッド」として統合できる点だ。接続速度は9.6テラビット毎秒と、米国議会図書館の全蔵書を2秒以内でダウンロードできる帯域幅に相当する。9,216チップを束ねたスーパーポッドは、合計42.5エクサFLOPS(FP8)という途方もない計算能力を発揮する。
これは、NVIDIAの競合システムGB300 NVL72の0.36エクサFLOPSを100倍以上も上回る数値である。さらに、このスーパーポッドは合計1.77ペタバイトのHBM3Eメモリを共有でき、数千のプロセッサが同時に超高速メモリにアクセスできる設計となっている。Googleは「光回路スイッチング技術」を導入し、個別のチップに障害が発生してもミリ秒単位で自動的にデータ経路を再構築する仕組みを実現した。
「推論時代」の到来がNVIDIA包囲網を加速――学習から推論へのパワーシフト
Googleの巨額投資の背景には、AI業界全体を揺るがす構造変化がある。「学習」から「推論」への転換だ。「学習」とは、AIモデルに大量のデータを読み込ませて賢くする工程。一方「推論」は、完成したモデルを実際に動かして答えを出す工程を指す。
あなたがChatGPTに質問して回答を得るたび、その裏側では「推論」が走っている。Menlo Venturesの調査によれば、スタートアップ企業の74%が現在、計算リソースの大半を推論に費やしている。1年前は48%だった。大企業でも49%が計算資源の大部分を推論に振り向けている。この数値も前年の29%から急上昇している。投資会社Brookfieldは、2030年までにAI計算需要の75%が推論から生じると予測する。
この推論シフトが、チップ市場の勢力図を塗り替えつつある。学習には膨大なデータを一気に処理する「馬力」が必要で、NVIDIAのGPUが圧倒的な強みを持つ。しかし推論では、低遅延・高効率・コスト最適化が最優先される。ここに来て、GoogleのTPUなどの「推論に強いAIチップ」が競争力を発揮し始めているのだ。
モルガン・スタンレーは、推論フェーズが「訓練市場よりはるかに大きな機会」を生むと分析し、2025年から2028年にかけてデータセンターインフラへの投資が3兆ドルに達すると推計している。
日本企業が直面する選択――「NVIDIA囲い込み」vs「マルチベンダー戦略」の分岐点
では、日本企業はどう動くべきか。NVIDIAの牙城は依然として強固だ。同社はデータセンター向けAIチップ市場で90%超のシェアを握り続けている。その力の源泉は、チップそのものではなく「CUDA」と呼ばれるソフトウェア基盤にある。世界で400万人を超える開発者がCUDAに依存しており、15年以上にわたって蓄積されたコードとツールが「防護壁」として機能している。
あなたの会社がAI開発を始めるなら、NVIDIAを選ぶことで既存の膨大なコード資産やコミュニティの知見をすぐ活用できる。これがNVIDIAの圧倒的な強みだ。しかし、GoogleのTPUには別の強みがある。自社開発による低コスト構造、チップからソフトウェアまでの垂直統合による効率性、そしてオープンソースフレームワーク「vLLM」への対応でエコシステムを拡充している点だ。
Googleは2025年5月、分散推論システム「llm-d」をオープンソース化し、Red Hat、IBM Research、NVIDIA、CoreWeave、AMD、Cisco、Hugging Face、Intel、Lambda、Mistral AIといった業界リーダーが参画するコンソーシアムを立ち上げた。これにより、開発者はGPUとTPUを数行の設定変更だけで切り替えられるようになり、特定ベンダーへの依存度を下げられるようになった。日本市場では、クラウド支出が2025年の314億ドルから、年率17.3%という高成長を遂げ、2030年には698億ドルへと倍増すると見込まれている。
選択基準は明確だ。最先端モデルの開発を目指すならNVIDIA、推論最適化とコスト重視ならGoogleのTPUやAmazonのinferentia、リスク分散を優先するなら両方を併用する戦略が合理的といえるだろう。
文:細谷 元(Livit)
https://news.yahoo.co.jp/articles/563015bf765757d030095a06a70c440732e86c81?page=1
구글이 거는 「100만 칩」도박, 엔비디아 포위망의 비장의 카드 「Ironwood」는 추론 시대의 패자가 될 수 있을까 / 12/3(수) / AMP [앰프]
◇ Anthropic '100만 칩 계약'의 충격 ―― 수 백억 달러가 구글에 흘러간 이유
ChatGPT의 최대 대항마로 꼽히는 'Claude'. 그 Claude를 개발하는 AI기업 Anthropic이 2025년 10월 구글 클라우드와 '최대 100만개 칩에 접근하는 계약'을 체결했다. AI 업계 최대 인프라 투자로 주목을 받고 있다.
계약 금액은 「수 백억달러(수 조엔) 규모」라고 되어 있어 2026년에는 「1 기가 와트 초과」의 계산 능력이 온라인화할 전망이다. 1기가와트라고 하면, 약 100만 세대분의 전력 소비에 상당하는 엄청난 스케일이다. 이 계약으로 앤트로픽은 구글의 7세대 TPU 칩 '아이런우드' 최대 100만개 사용권을 획득했다.
이 규모의 칩군을 한 기업이 확보하는 예는 전대미문. 업계에서는 1만에서 5만개의 칩 집적으로도 '거대 클러스터'라고 불리는 것이 현상이다. 왜 Anthropic은 이 정도의 투자를 단행했는가. 동사의 크리슈나 라오 최고재무책임자는 "우리 고객들은 대기업부터 AI 원어민 스타트업까지 폭넓게 가장 중요한 업무에 클라우드를 활용하고 있다. 지수함수적으로 증대하는 수요에 응해 모델을 업계 최첨단으로 유지하려면, 이 확장된 계산 능력이 불가결하다」라고 설명한다.
실제로 앤트로픽의 대규모 고객 수는 지난 1년간 약 7배 증가했으며, 현재는 30만개가 넘는 기업 고객을 거느리고 있다. 이 계약으로 구글이 '이중의 이익'을 얻는 구조로 돼 있는 점도 간과할 수 없다. 구글은 이미 앤트로픽에 출자했고 이번 클라우드 계약으로 거액의 매출도 확보할 수 있기 때문이다.
◇ 7세대 TPU 아이언우드 실력 ―― 성능 4배 엔비디아 블랙웰 정면승부
그럼, Anthropic이 거액을 들여 확보한 「Ironwood」란, 어떠한 팁인가. Google이 2025년 11월에 일반 제공을 개시한 제7세대 TPU 「Ironwood」는, 전세대의 Trillium( 제6세대)과 비교해, 훈련과 추론의 양 워크 로드에서 4배 이상의 성능 향상을 실현했다.
5세대와의 비교에서는 무려 10배의 성능 개선을 달성했으며 구글 역사상 최강이자 가장 에너지 효율이 높은 맞춤형 칩이다. 단체 칩의 계산 능력은 FP8 정밀도로 4614 TFLOPS에 달한다. 이는 엔비디아의 최신 GB200(4856TFLOPS)에 육박하는 수준이며 이전 세대 H100(1979TFLOPS)의 2배 이상 성능을 구현하고 있다.
하지만 아이런우드의 진가는 단체 성능만이 아니다. 특기할 만한 것은 구글이 자체 개발한 고속접속 기술 '인터칩 인터커넥트'를 통해 최대 9216개의 칩을 단일 '슈퍼팟'으로 통합할 수 있다는 점이다. 접속 속도는 9.6테라비트 매초로, 미국 의회도서관의 모든 장서를 2초 이내에 다운로드할 수 있는 대역폭에 상당한다. 9,216칩을 묶은 슈퍼팟은 합계 42.5엑사FLOPS(FP8)라는 엄청난 계산능력을 발휘한다.
이는 엔비디아의 경쟁 시스템 GB300 NVL72의 0.36 엑사 플로프스를 100배 이상 뛰어넘는 수치다. 게다가 이 슈퍼팟은 합계 1.77 페타바이트의 HBM3E 메모리를 공유할 수 있어 수천 개의 프로세서가 동시에 초고속 메모리에 액세스할 수 있는 설계가 되어 있다. 구글은 '광회로 스위칭 기술'을 도입해 개별 칩에 장애가 발생해도 밀리초 단위로 자동으로 데이터 경로를 재구축하는 구조를 구현했다.
◇ '추론 시대'의 도래가 엔비디아 포위망을 가속화 ―― 학습에서 추론으로의 파워 시프트
구글의 거액 투자 배경에는 AI 업계 전체를 뒤흔드는 구조 변화가 있다. 학습에서 추론으로의 전환이다. 「학습」이란, AI모델에 대량의 데이터를 읽어들여 현명하게 하는 공정. 한편 「추론」은, 완성한 모델을 실제로 움직여 답을 내는 공정을 가리킨다.
당신이 ChatGPT에 질문해 답변을 얻을 때마다 그 이면에서는 '추론'이 달리고 있다. 멘로벤처스 조사에 따르면 스타트업 기업의 74%가 현재 계산 자원의 대부분을 추론에 소비하고 있다. 1년 전 48%였다. 대기업에서도 49%가 계산 자원의 대부분을 추론으로 돌리고 있다. 이 수치도 전년의 29%에서 급상승했다. 투자회사 브룩필드는 2030년까지 AI 계산 수요의 75%가 추론에서 나올 것으로 예측한다.
이 추론 시프트가 칩 시장의 판도를 바꿔놓고 있다. 학습에는 방대한 데이터를 한 번에 처리하는 '마력'이 필요하며 엔비디아의 GPU가 압도적인 강점을 지닌다. 그러나 추론에서는 저지연·고효율·비용 최적화가 최우선이다. 최근 구글의 TPU 등 '추론에 강한 AI 칩'이 경쟁력을 발휘하기 시작한 것이다.
모건스탠리는 추론 단계가 '훈련 시장보다 훨씬 큰 기회'를 낳을 것으로 분석하고 2025년부터 2028년에 걸쳐 데이터센터 인프라에 대한 투자가 3조달러에 이를 것으로 추산하고 있다.
◇ 일본 기업이 직면하는 선택 ――「NVIDIA 둘러싸기」vs「멀티 벤더 전략」의 분기점
그럼, 일본 기업은 어떻게 움직여야 할까. 엔비디아의 아성은 여전히 탄탄하다. 동사는 데이터 센터 전용 AI칩 시장에서 90% 초과의 점유율을 계속 쥐고 있다. 그 힘의 원천은 칩 그 자체가 아니라 'CUDA'라고 불리는 소프트웨어 기반에 있다. 전 세계에서 400만명이 넘는 개발자가 CUDA에 의존하고 있으며, 15년 이상에 걸쳐 축적된 코드와 도구가 '방호벽'으로 기능하고 있다.
당신의 회사가 AI 개발을 시작한다면 엔비디아를 택함으로써 기존의 방대한 코드 자산과 커뮤니티 지식을 바로 활용할 수 있다. 이것이 엔비디아의 압도적인 강점이다. 그러나 구글의 TPU에는 또 다른 강점이 있다. 자체 개발에 의한 저비용 구조, 칩으로부터 소프트웨어까지의 수직통합에 의한 효율성, 그리고 오픈 소스 프레임워크 「vLLM」에의 대응으로 에코 시스템을 확충하고 있는 점이다.
구글은 2025년 5월 분산 추론 시스템 'llm-d'를 오픈 소스화하고 레드햇, IBM 리서치, 엔비디아, 코어웨이브, AMD, 시스코, 허깅페이스, 인텔, 람다 및 미스트랄 AI와 같은 업계 리더가 참여하는 컨소시엄을 구성했다. 이에 따라 개발자는 GPU와 TPU를 몇 줄의 설정 변경만으로 전환할 수 있게 돼 특정 벤더에 대한 의존도를 낮출 수 있게 됐다. 일본 시장에서는 클라우드 지출이 2025년 314억 달러에서 연율 17.3%라는 고성장을 이루어 2030년에는 698억 달러로 2배 증가할 것으로 전망되고 있다.
선택 기준은 명확하다. 최첨단 모델의 개발을 목표로 한다면 엔비디아, 추론 최적화와 비용 중시라면 구글의 TPU나 아마존의 inferentia, 리스크 분산을 우선한다면 양쪽을 병용하는 전략이 합리적이라고 할 수 있을 것이다.
글 : 호소야 겐 (Livit)