OpenAI Trusted Access for Cyber로 풀린 사이버 방어 특화 모델, AISI 평가에서 멀티스텝 공격 시뮬레이션 정복과 6시간 만에 등장한 유니버설 탈옥의 의미

GPT-5.5-Cyber는 OpenAI가 4월 30일 공개한 사이버 방어 특화 프런티어 모델이다. 영국 AI 보안기관 AISI가 "테스트한 모델 중 가장 강하다"고 평가했고, 네트워크 공격 시뮬레이션 98%·취약점 연구 92%를 풀어냈다. 다만 6시간 만에 유니버설 탈옥이 발견됐고, 모델은 Trusted Access for Cyber 프로그램을 통해 정부·핵심 인프라 운영자에게만 풀린다.
GPT-5.5-Cyber, 무엇이 달라졌나
GPT-5.5-Cyber는 4월 23일 출시된 베이스 GPT-5.5 위에 사이버 방어 워크로드를 더 깊이 학습시킨 분기 모델이다. OpenAI는 이 모델이 침투 테스트(pentesting), 버그 발견과 익스플로잇 작성, 멀웨어 리버스 엔지니어링까지 한 흐름에서 처리한다고 설명한다. 베이스 GPT-5.5가 일반 코딩·에이전트 작업에서 GPT-5.4를 뛰어넘었다면, Cyber 분기는 그 능력을 보안 운영센터(SOC)와 취약점 분석 파이프라인 쪽으로 전이시켰다.
출시 발표는 4월 30일에 떴고, 본격 롤아웃은 "다음 며칠 안"으로 예고됐다. 발표는 같은 주에 나온 OpenAI–AWS Bedrock 동시 상륙 소식과는 완전히 다른 결의 이벤트다. 일반 클라우드 시장이 아니라 "신뢰 기반 게이트"라는 새 분배 채널을 여는 신호다.
한눈에 보는 핵심
- 발표일: 2026년 4월 30일 (롤아웃 "다음 며칠 안")
- 베이스: GPT-5.5 (4월 23일 출시) 위에 사이버 분기 학습
- 분배 채널: Trusted Access for Cyber (TAC) 프로그램
- OpenAI 시스템 카드 사이버 위험 등급: High (Critical 미만)
- AISI 평가: "테스트한 모델 중 가장 강한 사이버 모델"
AISI가 인정한 98% — 벤치마크는 어떻게 달랐나
OpenAI 시스템 카드에 따르면 GPT-5.5는 GPT-5.4 대비 사이버 작업 평균 성공률이 더 높았고, 성공당 비용은 더 낮았다. Cyber 분기에서 가장 두드러진 수치는 세 축이다. 네트워크 공격 시뮬레이션(Network Attack Simulation) 98%, 취약점 연구·익스플로잇(Vulnerability Research and Exploitation) 92%, 회피(Evasion) 챌린지 54%다. 회피 점수가 상대적으로 낮은 것은 모델이 "기본 방어를 뚫는 능력"보다 "정상적인 공격 시나리오 풀이 능력"이 압도적으로 강하다는 뜻이다.
독립 평가도 함께 들어왔다. 영국 AI Security Institute(AISI)는 "GPT-5.5-Cyber는 우리가 사이버 태스크에서 테스트한 모델 중 가장 강한 모델 중 하나이며, 멀티스텝 공격 시뮬레이션을 처음부터 끝까지 완수한 두 번째 시스템"이라고 평가했다. 이 멀티스텝 종단 완수는 단순 단편 풀이와는 다르다. 정찰부터 권한 상승, 횡적 이동, 탈출까지의 시나리오를 사람의 개입 없이 한 트레이스로 통과시켰다는 의미다.
네트워크 공격 시뮬레이션 98%
정찰·권한 상승·횡적 이동을 포함한 종단 시뮬레이션에서 거의 모든 단계 통과. AISI가 "처음부터 끝까지 완수한 두 번째 시스템"이라 평가한 핵심 영역.
취약점 연구 92%
소스·바이너리에서 결함을 찾고 PoC 익스플로잇까지 만드는 워크플로 정확도. 방어자에겐 자동 패치 우선순위, 공격자 입장에선 자동화된 0-day 파이프라인 위협.
회피 챌린지 54%
EDR·로깅·이상탐지를 우회하는 시나리오는 상대적으로 약함. OpenAI는 "공격력 자체보다 정상 풀이 능력"으로 분배의 명분을 만든다.
시스템 카드 High
OpenAI 자체 분류는 "High"로, 자율적 0-day 개발이 가능한 Critical 임계값은 넘지 않는다는 입장. 다만 마진은 점점 좁아지는 모양새.
누가 쓸 수 있나 — TAC 프로그램 게이트키핑
GPT-5.5-Cyber는 일반 ChatGPT나 API에 풀리지 않는다. 분배는 Trusted Access for Cyber(TAC)라는 새 신뢰 채널을 통해서만 이뤄진다. 대상은 정부 기관, 핵심 인프라 운영자, 보안 벤더, 클라우드 플랫폼, 금융기관이다. OpenAI는 같은 페이지에서 "방어 측이 공격자보다 한 발 앞서야 한다"는 명분과 함께, 모델 접근을 신원 검증·계약 기반으로 제한한다고 못 박았다.
이 구조는 4월 7일 Anthropic이 Mythos를 Project Glasswing(아마존·애플·브로드컴·시스코·CrowdStrike·Linux Foundation·마이크로소프트·Palo Alto)에만 공개한 모델과 닮아 있다. 다만 OpenAI는 8개사 폐쇄형이 아니라 카테고리 기반 신뢰 채널로 운영해, 정량적으로 "몇 곳"에 풀릴지는 더 넓다. The Register는 "OpenAI가 Anthropic을 '벨벳 로프'라고 비판해놓고 결국 같은 길을 갔다"는 비꼼 섞인 분석을 내놨다.
한국에서 이 모델을 직접 만져볼 가능성은 당분간 낮다. 다만 KISA, 금감원, 통신3사 보안조직, 클라우드 MSP 정도는 글로벌 파트너십을 통해 우회 접근 협상이 가능할 것으로 보인다. 내가 가장 주목하는 건 "TAC 자체가 표준이 될지"다. 한 번 신뢰 채널 모델이 자리잡으면, 다음 세대 보안 LLM은 "공개 출시"라는 단어가 사라진 채로 나올 가능성이 매우 높다.
High 등급 + 6시간 유니버설 탈옥이라는 모순
시스템 카드의 사이버 위험 등급은 "High"다. OpenAI 분류 체계에서 Critical은 "자율적인 0-day 익스플로잇 개발이 인간 개입 없이 가능"한 수준을 의미하고, GPT-5.5-Cyber는 거기에 미치지 못한다는 입장이다. 그러나 같은 시스템 카드에는 한 줄짜리 경고도 들어 있다. 전문가 레드팀이 6시간 작업 끝에, 모든 악성 사이버 쿼리에 대해 보호장치를 우회하는 단일 프롬프트(유니버설 탈옥)를 발견했다는 것이다.
"6시간 안에 풀린 유니버설 탈옥"의 무게를 가볍게 보면 안 된다. 일반 모델 평가에서 이런 탈옥은 보통 며칠에서 몇 주의 협업 끝에 나온다. 사이버 특화 분기에서 6시간이라는 숫자는 두 가지 의미가 있다. 첫째, 자체 평가 안의 마진이 생각보다 얇다. 둘째, "신뢰 채널 안에서만 돈다"는 전제가 무너지는 순간—내부 인사이더, 계정 탈취, 한 번의 모델 가중치 유출—이 발견은 곧장 공격 자동화로 전환될 수 있다.
Mythos vs GPT-5.5-Cyber, 두 베팅의 차이
두 모델은 "안전상의 이유로 일반 공개를 안 한다"는 결론은 같지만, 운영 모델은 다르다. Anthropic Mythos는 Project Glasswing이라는 8개 거대 파트너 동맹 안에서 도는 폐쇄 신탁이다. 4M 달러를 오픈소스 보안 단체에 기부하고, 100M 달러어치 사용 크레딧을 파트너에 지원하는 식의 "산업 차원 공동방위" 프레이밍이 강하다. 반면 OpenAI GPT-5.5-Cyber는 카테고리 기반 신뢰 프로그램(TAC)을 만들어 가입 자격 자체를 표준화했다. 폐쇄형 동맹 vs 카테고리형 클럽의 차이다.
두 베팅이 모두 살아남으면 사이버 LLM은 두 갈래로 갈린다. 한쪽엔 산업 표준을 같이 쓰는 폐쇄 동맹이, 다른 쪽엔 자격 기반으로 신청과 검증을 거치는 신뢰 채널이 놓인다. 어느 쪽이든 "공개 출시"라는 단어는 한동안 사이버 분야에서 사라진다는 점은 이미 정해진 흐름으로 보인다.
자주 묻는 질문 (FAQ)
Q1. GPT-5.5-Cyber는 일반 사용자도 쓸 수 있나?
아니다. ChatGPT나 API에 풀리지 않으며, Trusted Access for Cyber(TAC) 프로그램에 등록된 정부·핵심 인프라·보안 벤더·클라우드·금융기관만 접근할 수 있다.
Q2. Anthropic Mythos와 무엇이 다른가?
Mythos는 8개사가 참여하는 Project Glasswing 폐쇄 동맹 안에서만 돈다. GPT-5.5-Cyber는 카테고리 기반 신뢰 채널(TAC)을 통해 더 폭넓게, 그러나 신원·계약 기반으로 분배된다.
Q3. "유니버설 탈옥"이란 정확히 무엇인가?
모델의 안전 정책 전체를 우회해 모든 악성 쿼리에 응답을 끌어내는 단일 프롬프트다. 전문가 레드팀이 6시간 만에 발견했다는 점이 핵심 위험 신호다.
Q4. AISI 평가가 중요한 이유는?
영국 AI Security Institute는 정부 산하 독립 평가 기관이다. "테스트한 가장 강한 사이버 모델 중 하나"이며 멀티스텝 종단 시뮬레이션을 완수한 두 번째 시스템이라는 평가는 OpenAI 자체 보고와는 다른 무게를 갖는다.
📚 함께 읽으면 좋은 글
→ GPT-5.5 바이오 버그바운티 개막 — 25,000달러 유니버설 탈옥에 걸렸다 → OpenAI 마이크로소프트 독점 끝났다 — AWS Bedrock에 GPT-5.5 동시 상륙 → 에르고영역 불안정성, 약난류로 포화된다 — 블랙홀 흉내쟁이의 새 청진기참고 자료
OpenAI — Trusted access for the next era of cyber defense (공식 발표) OpenAI Deployment Safety Hub — GPT-5.5 시스템 카드 사이버 섹션 UK AISI — Our evaluation of OpenAI's GPT-5.5 cyber capabilities Dataconomy — OpenAI Expands Trusted Access Program With GPT-5.5-Cyber The Register — OpenAI locks GPT-5.5-Cyber behind velvet rope