최상위 모델도 며칠 만에 사라질 수 있다는 경고
Anthropic은 6월 9일 새 최상위 모델인 를 공개했다. 6월 12일 미국 정부가 국가 안보를 이유로 를 내렸고, Anthropic은 이를 따르기 위해 와 를 모든 고객에게서 중단했다.
다른 Anthropic 모델은 계속 사용할 수 있었다. 공식 설명에 따르면 문제의 근거는 모델에 를 읽고 을 고치게 하는 방식의 좁은 탈옥 가능성이었다.
Anthropic은 같은 다른 공개 모델도 비슷한 일을 할 수 있으며, 이런 기능은 방어자가 매일 쓰는 정상적인 보안 작업이라고 반박했다. 에이전트 구축 관점에서는 비용이나 뿐 아니라, 규제나 지정학적 이유로 핵심 모델이 예고 없이 사라질 수 있다는 위험이 드러난다.
핵심 포인트
- 는 공개 3일 뒤 미국 정부 지시로 중단됐다.
- Anthropic은 와 를 모든 고객에게서 회수했다.
- 문제 사유는 를 읽고 결함을 고치게 하는 탈옥 가능성이었다.
- Anthropic은 이 기능이 방어용 보안 작업에도 쓰인다고 반박했다.
- 에이전트 설계에는 비용뿐 아니라 모델 중단 위험도 포함해야 한다.