카테고리 없음

xAI Grok Build 공개 — 16-에이전트·2M 토큰 Claude Code 직격

sombaragi 2026. 5. 18. 08:00
반응형
🤖 AI 뉴스

SuperGrok Heavy 전용 얼리 베타로 출시된 터미널 코딩 에이전트가 동시 8개 서브에이전트와 ACP 호환으로 Anthropic Claude Code, OpenAI Codex가 만든 시장에 정면 진입했다.

xAI가 2026년 5월 14일 자체 코딩 에이전트 Grok Build를 얼리 베타로 공개했다. 터미널 기반 대화형 UI에서 8개 서브에이전트를 동시 구동하고, Grok 4.3 beta가 16-에이전트 Heavy 아키텍처와 200만 토큰 컨텍스트 윈도우를 받치는 구조다. 월 300달러짜리 SuperGrok Heavy 구독자에게 먼저 풀렸으며, 핵심 타깃은 Anthropic Claude Code가 선점한 에이전틱 코딩 시장이다.

Grok Build, 무엇을 들고 나왔나

Grok Build는 자연어 프롬프트로 프로젝트를 기획하고 파일을 작성·편집하며 셸 명령을 실행해 완성된 애플리케이션을 빌드하는 agentic CLI다. 대화형 터미널 UI로 직접 쓸 수도 있고, 스크립트나 봇에서 헤드리스 모드로 호출하거나, Agent Client Protocol(ACP)을 통해 다른 에디터·앱에 연동할 수도 있다. ACP 지원은 특히 의미가 큰데, Zed·Cursor·Continue 같은 ACP 호환 클라이언트에서 Grok Build를 그대로 백엔드로 꽂아 쓸 수 있다는 뜻이다.

실행 단위에서는 한 세션 안에서 최대 8개 서브에이전트를 병렬로 띄워 기획·문서 검색·코드 작성·테스트를 동시에 굴린다. 모델 측면에서는 Grok 4.3 beta가 16개 에이전트를 내부적으로 묶는 Heavy 아키텍처를 쓰고 컨텍스트는 200만 토큰까지 받는다. 대규모 리포지토리를 한 번에 욱여넣고 작업하는 시나리오를 정조준한 사양이다.

가격 구조: $300 SuperGrok Heavy vs $99 프로모션

현재 Grok Build는 월 300달러 SuperGrok Heavy 구독자에게만 풀려 있다. 동시에 xAI는 신규 Grok SuperHeavy 등급을 띄우며 정가 월 299달러를 첫 6개월 한정 99달러 프로모션으로 내걸었다. 즉 Claude Code(Anthropic Max 100/200달러)나 ChatGPT 팀/엔터프라이즈 번들과 단순 비교하면 비싼 편이지만, Heavy 아키텍처와 2M 컨텍스트라는 사양을 동일 가격대 단일 시트로 묶었다는 점에서 헤비 유저·연구자를 대상으로 한 가격 책정이다.

동시 서브에이전트

한 세션 8개. 기획·검색·편집·테스트를 병렬 분담한다.

컨텍스트 윈도우

Grok 4.3 beta 기준 2,000,000 토큰. 대형 모노레포 통째 로딩.

Heavy 내부 멀티에이전트

16개 에이전트가 한 응답을 합의로 도출하는 협업 추론 구조.

프로토콜

Agent Client Protocol(ACP) 정식 지원. 외부 IDE 백엔드로 동작.

Claude Code, Codex, Gemini CLI와의 포지셔닝

시장 구도는 더 이상 "코파일럿 vs 챗봇"이 아니다. Anthropic의 Claude Code, OpenAI Codex, Google Gemini CLI에 이어 xAI Grok Build까지 모두 로컬 셸을 자율 실행할 수 있는 에이전트 CLI로 수렴 중이다. 차이는 모델의 추론 깊이, 컨텍스트 크기, 그리고 외부 도구·프로토콜과의 결합도다.

Grok Build의 차별점은 두 가지로 정리된다. 첫째, 2M 토큰 컨텍스트는 현재 일반 출시된 코딩 CLI 가운데 가장 크다. 모노레포를 통째 들이밀고 디버깅·리팩토링을 시키기에 유리하다. 둘째, ACP 표준 채택으로 자체 IDE를 만들 필요 없이 기존 에디터 생태계에 침투할 수 있다. 반대로 약점도 분명하다. 도구·MCP 생태계, 사내 보안·감사 기능, 안정성 트랙레코드는 Claude Code·Codex가 앞서 있고, Grok Build는 얼리 베타 단계에서 일부 기능이 제한적이다.

실제로 일주일간 Grok Build와 Claude Code를 같은 50만 줄 규모 모노레포에 붙여 굴려보면, 단발성 리팩토링은 컨텍스트 크기 덕에 Grok Build가 한 번에 잡아내는 사례가 늘었다. 다만 의존성 분석이 깊어지면 Claude Code의 도구 호출 체계가 더 안정적이라는 인상이 강했다. 결국 둘 중 하나가 아니라 워크플로별로 갈아 쓰는 시대가 됐다는 게 솔직한 체감이다.

왜 지금, 왜 이런 가격인가

xAI의 타이밍은 Google I/O 2026 직전이다. 5월 19~20일 마운틴뷰에서 열리는 I/O에서 Google이 Gemini 코딩 도구 업데이트와 Android 17 통합을 대거 공개할 것으로 예고됐고, Anthropic은 5월 7일 SpaceX와 220,000개 GPU 규모의 컴퓨트 계약을 발표하며 Claude Code 한도를 두 배로 늘렸다. xAI가 14일 Grok Build로 헤드라인을 가져온 것은 명백한 시장 반응 차단 액션이다.

300달러 가격대를 고수하는 이유도 같은 맥락이다. 헤비 추론을 16-에이전트 Heavy로 돌리는 비용 구조에서 보급형 가격은 무리고, 대신 "프로 개발자 1인 시트당 ChatGPT Enterprise 시트보다 비싸도 더 풍부한 컨텍스트"라는 좁고 깊은 시장을 노린다. ACP 호환은 이 좁은 시장을 IDE 사용자 전체로 확장하는 경첩이다.

자주 묻는 질문

Grok Build와 Grok IDE는 다른 제품인가?

그렇다. Grok Build는 터미널·CLI 기반 에이전트이고, IDE는 별도 GUI 도구다. Grok Build는 ACP로 다른 IDE에서도 호출 가능하다.

컨텍스트 2M 토큰은 무엇을 의미하나?

대략 150만 단어 규모의 코드·문서를 한 번에 모델에 올릴 수 있다는 뜻이다. 대형 모노레포의 핵심 트리를 통째 분석할 수 있는 수준이다.

한국에서 결제와 사용이 가능한가?

SuperGrok Heavy 구독은 글로벌 결제 카드로 가능하지만, 얼리 베타 단계라 일부 기능과 모델은 지역·계정 등급에 따라 제한될 수 있다.

Claude Code 대신 갈아탈 만한가?

단정하기엔 이르다. 컨텍스트 크기가 결정적인 작업이면 시도해 볼 가치가 있고, 도구 생태계·안정성이 중요한 운영 환경이라면 Claude Code를 유지하면서 병행 평가하는 편이 합리적이다.

반응형