카테고리 없음

Anthropic 구글에 200조 베팅 — TPU 3.5GW 5년 독점 잡았다

sombaragi 2026. 5. 9. 08:00
반응형
🤖 AI 뉴스

5월 5일 The Information 보도로 드러난 200조원 컴퓨트 계약은 Google Cloud 백로그의 40%를 한 건으로 채웠고, 2027년부터 3.5기가와트 차세대 TPU가 Claude를 뒷받침한다.

Anthropic이 5년간 Google Cloud에 약 200조원(USD 200B)을 지불하고 차세대 TPU 약 3.5GW급 전용 컴퓨트를 확보하는 계약을 체결했다. 보도 시점은 5월 5일(현지) The Information, 후속 분석은 5월 6~8일에 걸쳐 Engadget·CNBC·HPCwire에서 동시에 나왔다. 이는 단일 클라우드-칩 거래로는 사상 최대 규모로, Google 모회사 Alphabet이 공시한 클라우드 백로그 4,600억 달러 가운데 40% 이상을 한 고객사가 차지하는 결과를 만들었다.

200조원 — 무엇을 사는가

계약의 핵심은 "Google이 설계하고 Broadcom이 양산하는" 차세대 TPU의 멀티-기가와트급 캐퍼시티다. Broadcom의 규제 공시에 따르면 2027년부터 단계적으로 약 3.5GW에 달하는 TPU 클러스터가 Anthropic 전용으로 배정되며, 계약은 2031년까지 이어진다. 2025년 10월에 체결한 1GW·100만 TPU 합의를 기준으로 약 3.5배 확장된 것이다.

총 약정 금액

5년간 USD 200B (≈ 280조원). Google Cloud 백로그 4,600억 달러 중 40%+.

컴퓨트 규모

차세대 TPU + Broadcom XPU 기반 멀티-기가와트(약 3.5GW), 2027년 가동 시작.

계약 기간

2027~2031, 다년 단계적 인도. 기존 2025-10 1GW 합의를 갱신.

트라이-벤더 구조

AWS Trainium · Google TPU · NVIDIA GPU 동시 사용. Claude는 세 칩 위에서 학습된다.

왜 NVIDIA가 아니라 TPU인가

결정적인 변수는 단가가 아니라 전력 밀도와 공급 가시성이다. NVIDIA HGX 서버는 칩 수급이 18개월 단위 락에 가까운 반면, Google TPU v7p 이후 라인업은 Google 자체 데이터센터에서 직접 가동되며 Broadcom의 SerDes·HBM 인터커넥트가 패키징을 분담한다. 모델 학습 손익분기에 결정적인 "와트당 토큰" 효율에서 TPU가 NVIDIA Blackwell 대비 25~35% 앞선다는 분석이 2025년 하반기부터 누적됐고, 이번 계약은 그 결과를 확정짓는다.

Anthropic은 학습 인프라를 단일 칩에 묶지 않는다는 원칙을 유지한다. AWS Trainium2/3는 Bedrock 추론과 인퍼런스 비용 최적화, Google TPU는 프런티어 학습과 대형 RL 런, NVIDIA GPU는 고성능 멀티모달과 외부 연구 협업에 사용된다. 이번 200조원은 그 가운데 "학습 코어"를 5년 단위로 잠그는 결정이다.

$30B 매출의 뒷면

Anthropic의 런레이트 매출은 2025년 말 90억 달러에서 2026년 5월 기준 300억 달러로 약 3.3배 늘었다. 같은 기간 연간 100만 달러 이상을 쓰는 엔터프라이즈 고객 수는 500개에서 1,000개로 5주 만에 두 배가 됐다. 5월 6일 발표된 Anthropic 금융 에이전트 10종, Microsoft 365 Claude 애드인이 이 흐름을 가속한 것으로 분석된다.

매출과 컴퓨트의 산수

  • 2026년 런레이트 매출 USD 30B → 5년 누적 매출 가정 USD 200~250B
  • Google에 약정한 USD 200B는 5년 매출과 거의 동일한 규모 — 사실상 매출의 80% 이상이 컴퓨트로 환류
  • 단, Anthropic의 ARR 성장률이 70%/년 유지 시 누적 매출은 USD 400~500B로 늘어 컴퓨트 비중 40% 안팎으로 정상화
  • 2027년 가동 시점에 한해 일시적인 마이너스 마진 구간이 발생하나, 2028~2029년에 회복되는 곡선

Google·Broadcom·NVIDIA에 의미하는 것

Alphabet 입장에서 200조원은 단순한 매출이 아니라 커스텀 칩 모델의 검증이다. AWS는 Trainium으로, Microsoft는 Maia로 각자의 트라이-벤더 자원을 키웠지만 외부 프런티어 랩이 5년 단위로 단일 클라우드에 락-인한 사례는 없었다. Broadcom은 이 계약 발표 직후 시가총액이 단일 거래 발표로는 역대급 폭으로 상승했고, NVIDIA는 매출 비중에서 Anthropic 의존도가 추가로 떨어진다.

반대로 OpenAI는 같은 시기 TPG·베인과의 합작사를 통해 Microsoft Azure 의존도를 분산하는 정반대 시나리오를 실행 중이다. Anthropic의 "Google에 잠금", OpenAI의 "Azure에서 풀기"가 거울처럼 대칭을 이룬다.

엔터프라이즈 PoC 두 건을 운영하면서 가장 어색했던 건 "Claude는 정말 GPU에서 돌아가는가"라는 질문에 답하기 어려웠다는 점이다. 답은 "이제는 거의 TPU"가 됐다. 200조원이라는 숫자보다 더 충격적인 것은, 5년 뒤 우리가 사용하는 Claude 응답 한 줄 한 줄이 Google 데이터센터 발열을 거쳐온 토큰일 가능성이 90% 이상이라는 사실이다. 모델 선택은 칩 선택을 동반한다는 명제가 처음으로 계약서로 증명된 사건이다.

한국 기업이 읽어야 할 신호

국내 LLM 사용자 입장에서 단기 영향은 두 가지다. 첫째, 2027년 이후 Claude API 가격은 TPU 단가 곡선을 따라간다. NVIDIA H200 의존도가 줄면 환율과 GPU 수급에 덜 민감해지지만, 한국 데이터센터에 위치한 워크로드는 여전히 us-central·asia-southeast TPU 리전에 의존하므로 레이턴시 관리가 더 중요해진다. 둘째, 엔터프라이즈 도입 시 데이터 잔존 정책이 Google Cloud 약관을 따르게 되며, 기존 Bedrock 의존 고객은 이중 컴플라이언스 검토가 필요하다.

FAQ

Q1. Anthropic은 NVIDIA를 떠나는 건가?

아니다. 학습 코어가 TPU로 이동할 뿐, 멀티모달·외부 협업 워크로드는 여전히 NVIDIA Blackwell·Rubin에서 돌아간다. 트라이-벤더 원칙은 유지된다.

Q2. 3.5GW는 어떤 규모인가?

중형 원전 3~4기 출력에 해당한다. 평균 데이터센터 한 곳이 50~150MW이므로, 3.5GW는 대형 캠퍼스 20~30개를 24시간 가동하는 전력이다.

Q3. 200조원은 일시 지급인가?

아니다. 2027년부터 단계적으로 인도되는 컴퓨트에 대한 사용료 형태이며, 매출 인식은 Google 측에서 5년에 걸쳐 분할로 진행된다.

Q4. Claude API 사용자에게 무엇이 바뀌나?

즉시 바뀌는 건 거의 없다. 2027년 이후 모델 학습은 TPU 기반이지만 API 응답 자체는 멀티 클라우드 추론 엔진을 거치므로, 사용자가 체감하는 변화는 가격 안정과 컨텍스트 한도 확장에 그칠 가능성이 크다.

반응형