카테고리 없음

Claude Platform이 AWS에 GA — Opus 4.7·17개 리전 단일 계정

sombaragi 2026. 5. 13. 08:00
반응형
🤖 AI 뉴스

Anthropic이 AWS 네이티브로 들어왔다. 별도 계약·결제 없이 콘솔, Messages API, Files API, Managed Agents, Skills를 단일 AWS 계정으로 호출하고 서울 리전까지 즉시 사용 가능하다.

2026년 5월 11일, AWS가 Claude Platform on AWS의 일반 공급(GA)을 발표했다. AWS 단일 계정만으로 Anthropic이 직접 운영하는 네이티브 Claude API·콘솔·Skills·Managed Agents를 호출하고, 별도 회사와의 계약·결제·쿼터 관리 없이 Opus 4.7과 Sonnet 4.6, Haiku 4.5를 즉시 쓸 수 있는 첫 번째 클라우드 채널이 열렸다는 뜻이다.

Claude Platform on AWS는 정확히 무엇인가

Anthropic은 그동안 자체 도메인의 claude.com 콘솔과 API, 그리고 AWS Bedrock·Google Vertex 같은 클라우드 마켓을 통해 두 가지 경로로 Claude를 팔아왔다. 이번 GA는 그 둘 사이에 새로운 세 번째 경로가 들어선 격이다. AWS 계정 인증으로 들어가지만, 모델·콘솔·기능 묶음은 Anthropic 본가 그대로다.

AWS의 GA 노트가 못 박은 핵심은 세 가지. 첫째, Messages API, Files API, Message Batches API, Claude Managed Agents, Agent Skills, code execution, tool use를 네이티브 엔드포인트 그대로 호출한다. 둘째, 신규 기능과 얼리액세스 베타가 Anthropic 본가와 동시에 풀린다. 셋째, 운영 주체는 Anthropic이고, 따라서 고객 데이터는 AWS 보안 경계 바깥에서 처리된다.

핵심 요약

  • 발표: 2026-05-11, AWS 공식 What's New + Anthropic 블로그 동시 공개
  • 제공 모델: Claude Opus 4.7, Sonnet 4.6, Haiku 4.5 (이후 신모델 즉시 추가)
  • 통합 API: Messages, Files, Message Batches, Managed Agents, Skills, code execution, tool use 네이티브 호출
  • 리전 17곳: N.Virginia/Ohio/Oregon, Canada Central, Dublin/London/Frankfurt/Paris/Milan/Stockholm/Zurich, Tokyo, Seoul, Jakarta, Sydney, Melbourne, São Paulo
  • 데이터 처리자: Anthropic (Bedrock과 결정적 차이)

Bedrock에 Claude를 띄우는 것과 무엇이 다른가

기존 Amazon Bedrock에서 Claude를 쓰는 모델은 AWS가 데이터 처리자가 되고, AWS의 IAM·GuardRails·CloudWatch 안에서 모델이 격자처럼 갇혀 돌아갔다. 신기능이 Anthropic 본가에 풀린 뒤 Bedrock으로 옮겨오기까지는 길게는 분기 단위 시차가 났다. Skills, Managed Agents, code execution 같은 신상 기능 일부는 끝내 들어오지 못했다.

Claude Platform on AWS는 정반대의 트레이드오프다. AWS 보안 경계 바깥으로 데이터가 흐른다는 부담을 받아들이는 대신, Anthropic 본가에서 베타로 나오는 모든 기능을 같은 시각에 만진다. 코드는 그대로 두고 결제·SSO·쿼터 관리만 AWS 콘솔로 통합하고 싶었던 팀에게는 단연 합리적인 옵션이 된다.

Bedrock 경로

AWS 데이터 처리, GuardRails·IAM 통합, 신기능 시차. 컴플라이언스 우선 팀에 적합.

Platform 경로

Anthropic 처리, 베타 동시 공개, Skills·Managed Agents 그대로. 빠른 기능 채택 팀용.

결제·계약

기존 AWS Enterprise 계약·EDP에 자동 포함, 별도 신용카드·구매 발주 불필요.

리전 선택

한국 사용자는 ap-northeast-2(Seoul)에서 호출, 데이터 잔류는 미국으로 흐를 수 있어 검토 필요.

왜 지금, AWS인가 — 200조 약정과의 연결

불과 2주 전 Anthropic은 Google과 5년간 200조 규모의 TPU 3.5GW 약정을 체결했다. 동시에 AWS·NVIDIA·Google의 트라이-벤더 전략을 유지하겠다고 못 박았다. 이번 GA는 그 다짐의 가시적 결과물이다. 학습 코어는 Google TPU로 옮겨갔지만, 추론 트래픽과 엔터프라이즈 채널은 AWS에 깊이 박는다는 두 트랙이 함께 굴러간다.

AWS 입장에서도 명분이 분명하다. OpenAI는 마이크로소프트 독점이 깨진 뒤 Bedrock에 GPT-5.5를 들였지만, 콘솔과 신기능까지 통째로 들이지는 못했다. AWS는 Claude Platform GA를 통해 처음으로 "프런티어 LLM의 본가 환경을 통째로 자기 계정 안에서 굴린다"는 시나리오를 시장에 내놓을 수 있게 됐다.

엔터프라이즈 PoC를 두 곳에서 굴려본 경험에 비추면, "Claude Skills를 본가에 풀린 그날 그대로 쓸 수 있는가"가 도입 결정의 임계 변수였다. Bedrock에서는 그게 늘 분기 단위로 늦었다. AWS 안에서 그 시차가 0이 되는 옵션이 생긴 것만으로도 다음 분기 도입 결재가 한결 쉬워질 것이라 본다.

개발자 체크리스트

국내 팀이 오늘 바로 점검할 항목은 네 가지다. (1) IAM 정책에 claude-platform:* 액션이 풀려 있는지, (2) 청구 대시보드의 새 SKU를 EDP 약정 한도 안에 산정했는지, (3) 데이터 처리자가 Anthropic으로 바뀌는 점이 사내 DPA·개인정보 위탁 고지 범위에 들어가는지, (4) Skills와 Managed Agents 호출 시 사용하는 도구 권한이 Bedrock GuardRails 같은 격자 없이 무방비로 외부 API를 때리지 않는지.

코드 마이그레이션은 의외로 단순하다. api.anthropic.com을 호출하던 SDK 호출에서 엔드포인트를 AWS가 발급하는 리전 호스트로 바꾸고, 인증 헤더를 SigV4로 갈아주면 끝이다. Messages API 스키마는 동일하기 때문에 기존 프롬프트·도구 정의·Skills 패키지를 그대로 옮길 수 있다.

남은 변수

데이터 잔류와 리전 매핑이 가장 큰 변수다. AWS 발표에는 17개 리전이 나열돼 있지만, Anthropic 운영 인프라가 실제로 서울에서 끝까지 닫혀 돌아가는지 - 즉 추론 중 미국으로 라우팅되지 않는지 - 는 별도 SLA 문서로 확인해야 한다. 또한 Bedrock 전용 기능인 GuardRails, Knowledge Bases, Agents Multi-LLM Orchestration과의 상호운용성도 GA 직후 단계에서는 명시되어 있지 않다.

가격도 흥미롭다. AWS 발표문은 "Anthropic 본가 단가와 동일"이라고 적었지만, AWS의 사적인 약정 할인(EDP, Private Pricing)을 어떻게 적용할지가 큰 기업 고객의 도입 속도를 좌우할 것이다. 5월 말~6월 초 AWS re:Inforce·Anthropic Builder Day 같은 후속 이벤트에서 디테일이 더 풀릴 전망이다.

FAQ

Q1. Bedrock의 Claude는 어떻게 되나?

그대로 유지된다. 두 경로는 병존하며, AWS는 컴플라이언스 우선 고객을 Bedrock에, 기능 우선 고객을 Platform에 두는 분리 운영 전략을 명시했다.

Q2. 청구는 어디로 나오나?

AWS 마스터 계정의 통합 청구서에 별도 SKU로 합산된다. Anthropic이 운영하지만 결제 계약은 AWS와의 기존 계약 안에 포함된다.

Q3. 한국 데이터는 한국에 머무르나?

호출 엔드포인트는 ap-northeast-2를 쓸 수 있으나, 학습·로깅·세이프티 평가 데이터의 흐름은 Anthropic의 글로벌 정책을 따른다. 민감 데이터 처리에는 별도의 BAA/DPA 검토가 필요하다.

Q4. 신모델 GA 직후에도 동시에 풀리나?

그렇다. Anthropic은 "본가와 동시 출시"를 GA의 핵심 약속으로 명시했다. Opus 4.7·Sonnet 4.6·Haiku 4.5가 첫 라인업이며, 이후 모델은 본가 출시 당일 자동 추가된다.

반응형