GPT-5.5, 6시간 만에 보안 우회 성공 — 영국 정부 기관이 공식 확인
영국 AI 안전 연구소(AISI)가 OpenAI의 를 평가하던 중, 전문 보안 연구원들이 단 6시간의 작업으로 ''을 개발했다. 이 공격은 OpenAI가 제시한 악성 사이버 보안 관련 질문 전체에서 의 안전 장치를 무력화했으며, 여러 번의 대화가 오가는 자율 실행 환경에서도 통했다. OpenAI는 이후 안전 장치를 여러 차례 업데이트했지만, 제공된 버전의 설정 문제로 인해 AISI는 최종 버전의 효과를 직접 검증하지 못했다.
이 평가 보고서는 2026년 4월 30일 공개됐으나, 미국 정부 관련 사건 이후 뒤늦게 주목받기 시작했다. AISI는 별도로 라는 모델도 분석했는데, 해당 버전은 안전 장치 자체가 거의 없었다.
핵심 포인트
- 영국 AI 안전 연구소(AISI)가 평가 중 범용 탈옥을 공식 발견했다
- 전문가 6시간 작업으로 모든 악성 사이버 쿼리에서 안전 장치를 우회했다
- 다중 대화 에서도 공격이 통했다
- OpenAI가 패치를 적용했지만 AISI는 최종 버전의 효과를 검증하지 못했다
- 이 보고서는 4월 말 공개됐으나 최근에야 널리 알려졌다