
Google Cloud CEO 토마스 쿠리안은 이번 발표를 "모델 시장에서 에이전트 시장으로의 전환"이라고 못 박았다. 지난 12개월 사이 Anthropic의 MCP, OpenAI의 Agent Kit, Microsoft의 Copilot Studio가 엔터프라이즈 에이전트 경쟁을 먼저 자극했고, Google은 이에 대응할 단일 진입점을 필요로 했다. 기존 Vertex AI는 모델 서빙과 MLOps 중심으로 설계돼 있어 도구 호출, 장기 메모리, 멀티 에이전트 오케스트레이션을 추가로 붙이려면 파편화된 SDK를 조합해야 했다.
새 플랫폼은 Build · Scale · Govern · Optimize라는 네 기둥으로 구조를 다시 잡았다. 기업 고객이 "에이전트를 언제, 어떻게 만들고 누가 책임지는가"를 한 대시보드에서 답할 수 있게 만든 것이 핵심이다. 발표 직후 Salesforce·SAP·ServiceNow를 포함한 초기 파트너 50곳 이상이 이 플랫폼 위에 자사 업무 에이전트를 올리겠다고 선언했다.
Agent Studio와 ADK — 로우코드 vs 그래프 오케스트레이션
Agent Studio
자연어 설명만으로 에이전트의 목표·도구·가드레일을 설정하는 로우코드 인터페이스. 시각적 Agent Designer 캔버스가 프리뷰로 함께 공개됐다.
Agent Development Kit (ADK)
파이썬·Go SDK에 그래프 기반 멀티에이전트 오케스트레이션이 정식 편입. 슈퍼바이저·워커 패턴을 코드 몇 줄로 조립할 수 있다.
Agent Runtime
서브초 콜드스타트를 표방하는 신규 실행 환경. 관리형 MCP 서버, 관측성, 토큰·비용 대시보드가 기본 탑재된다.
Memory Bank
세션을 넘나드는 장기 기억 저장소. 사용자·팀·조직 단위로 격리된 벡터·KV 혼합 메모리로 설계됐다.
ADK의 그래프 프레임워크는 LangGraph와 유사한 상태 머신 방식이지만, Google은 각 노드가 Runtime 위에서 독립 스케일되도록 설계했다고 강조했다. 즉 '툴 호출 서버 하나가 터지면 그래프 전체가 멈추던' 기존 약점을 분산 실행으로 해결한다는 얘기다. Memory Bank는 Gemini 3 Pro의 긴 컨텍스트와 별개 레이어로 유지돼, 비용이 큰 1M 토큰 컨텍스트를 매 턴 재구성하지 않아도 된다.
A2A 프로토콜과 Project Mariner — 에이전트끼리 협업하는 표준
Cloud Next 2026의 또 다른 중심은 Agent2Agent(A2A) 프로토콜의 프로덕션 승격이다. 지난해 프리뷰로 공개된 A2A는 이번에 GA 상태가 되면서 Salesforce Agentforce, SAP Joule, ServiceNow Now Assist와 상호 인증을 맺었다. 서로 다른 벤더 에이전트가 작업·데이터·권한을 주고받을 때 사용하는 공용 포맷이다. Google은 A2A를 오픈 스펙으로 재공개했고, Linux Foundation 산하 거버넌스에 편입시키겠다고 발표했다.
A2A 핵심 스펙
- 에이전트 카드(agent card) JSON으로 능력·권한·SLA를 선언
- 작업은 태스크 단위로 이관되며 스트리밍·중단·재개를 표준화
- Workload Identity Federation을 통한 신원·감사 로그 자동 연동
- Anthropic MCP와 상호 운용 가능 — MCP는 도구, A2A는 에이전트 간
웹 브라우저를 직접 조작하는 Project Mariner는 WebVoyager 벤치마크 83.5%로 최신 상태를 경신하며 동시 10개 태스크 병렬 수행을 지원한다. 미국 Google AI Ultra 구독자에게 먼저 풀렸고, 기업 고객은 Gemini Enterprise Agent Platform에서 Mariner 워커를 호출해 양식 작성·정보 조회·간단한 구매 플로우를 자동화할 수 있다.
Workspace Studio — 개발자 없는 부서도 에이전트를 만든다
가장 빠르게 번질 것으로 보이는 기능은 Workspace Studio다. Gmail·Docs·Sheets·Drive·Meet·Chat을 대상으로 "이메일에서 인보이스 PDF를 추출해 Sheets에 입력하고, 500달러 초과면 매니저에게 Chat으로 승인 요청을 보내줘" 같은 자연어 명령을 그대로 상시 자동화로 만든다. 어드민이 감사 로그·데이터 범위·실행 한도를 중앙에서 통제하고, 실행은 Runtime으로 위임한다. Google Cloud는 첫날부터 파트너사의 에이전트 개발을 가속하기 위해 7억 5천만 달러 규모의 파트너 기금도 별도 공개했다.
Gemini 3 라인업과 2.5 세대 일몰
Gemini 3 Pro
가장 강력한 추론 변종. 1M 토큰 컨텍스트와 Thinking 모드 두 단계, 에이전트 기본 백본.
Gemini 3 Flash
Gemini 2.5 Flash 대비 정확도 15% 향상, 고빈도 에이전트 워크플로우 최적화.
Gemini 2.5 Series
2026년 10월 사용 중단 예정. 기존 고객은 마이그레이션 가이드와 자동 라우팅 옵션 제공.
3rd Party Models
Agent Platform 모델 가든에 Claude, Llama, Mistral 등 200+ 모델 등재 — 에이전트 노드별로 다른 모델 지정 가능.
에이전트 한 개를 Vertex AI와 LangGraph 조합으로 프로덕션에 올려 본 사람 입장에서 이번 리브랜드가 가장 반가운 부분은 Memory Bank와 Agent Runtime의 관리형 결합이다. 지금까지는 Pub/Sub·Cloud Tasks·Firestore·Redis·Spanner를 직접 꿰매야 "장기 기억과 빠른 콜드스타트"라는 상충 요구를 만족시킬 수 있었다. 하지만 실제 업무에서는 관측성과 감사가 더 큰 벽이었는데, Agent Platform이 그걸 플랫폼 수준에서 표준화한 것이 조직 도입 속도를 바꿀 가능성이 크다 — 물론 락인 위험은 그대로 커진다는 대가가 붙는다.
자주 묻는 질문 (FAQ)
Q1. 기존 Vertex AI SDK 코드는 어떻게 되나?
2027년 4월까지 완전 호환. google-cloud-aiplatform 패키지는 유지되며, 내부적으로 신규 엔드포인트로 자동 매핑된다. 에이전트 기능을 쓰려면 google-cloud-agent-platform으로 이관을 권장한다.
Q2. A2A와 MCP 중 무엇을 먼저 배워야 하나?
역할이 다르다. MCP는 에이전트가 도구·데이터에 접근하는 스펙, A2A는 에이전트끼리 태스크를 위임하는 스펙이다. 단일 에이전트만 만드는 단계면 MCP가 먼저, 멀티에이전트 조직을 설계할 단계라면 A2A까지 챙겨야 한다.
Q3. Memory Bank는 유료인가?
GA 단계에서 저장 GB·월과 읽기·쓰기 연산량 기반 과금이다. 다만 Agent Runtime 번들 플랜을 선택하면 월 1GB + 100만 회 호출까지 포함된다.
Q4. Project Mariner를 기업용 플로우에 붙일 수 있나?
Agent Platform에서 Mariner를 도구 노드처럼 호출할 수 있다. 단 VPC·PII 정책은 엄격하게 걸리며, 금융·의료 등 규제 업종은 별도 승인 프로세스를 거쳐야 한다.