Claude Fable 5, 위험 분야만 다른 모델로 넘긴다는 주장

Anthropic이 2026년 6월 9일 를 공개했다는 내용이다. 이 모델은 소프트웨어 개발, 연구, 이미지 이해 같은 여러 벤치마크에서 가장 높은 성능을 냈다고 소개된다. 특히 길고 복잡한 작업일수록 이전 모델보다 차이가 더 커진다고 한다.

핵심은 안전 장치다. 사이버보안, 생물학·화학, 모델 증류처럼 악용될 수 있는 좁은 주제에 질문이 들어오면 가 직접 답하지 않고 이 자동으로 대신 답한다. 사용자는 이 전환을 항상 알 수 있고, 이런 전환은 전체 세션의 5% 미만에서 일어난다고 한다.

같은 모델에서 제한을 뺀 도 있지만, 현재는 Glasswing 프로그램에 들어간 일부 사이버 방어자와 핵심 기반 시설 운영자만 쓸 수 있다. Anthropic은 앞으로 신뢰 접근 프로그램을 통해 방어 목적의 사이버보안과 생의학 연구 쪽으로 접근을 넓힐 계획이라고 한다.

핵심 포인트

  • 는 2026년 6월 9일 공개된 새 Claude 모델로 소개된다.
  • 길고 복잡한 코딩·연구·이미지 이해 작업에서 이전 모델보다 강하다고 한다.
  • 사이버보안, 생물학·화학, 모델 증류 질문은 이 대신 처리한다.
  • 제한 없는 는 현재 검증된 일부 방어 목적 사용자에게만 제공된다.
  • 일반 사용자는 대부분의 작업에서 를 쓰지만, 위험 주제에서는 답변 흐름이 달라질 수 있다.
원문 보기