Claude Fable 5: Anthropic, Claude Mythos의 ‘안전한’ 버전 출시

Anthropic은 강력하지만 이전에 제한되었던 Mythos 모델의 공개 버전인 Claude Fable 5를 출시했습니다. 가장 위험한 기능이 잘못된 손에 들어가지 않도록 설계된 새로운 안전 가드 레일 세트가 포함되어 있습니다. 이 “일반 사용에 안전한” 모델과 함께 Anthropic은 안전 가드 레일이 없는 Fable 버전인 Claude Mythos 5도 신뢰할 수 있는 테스트 파트너에게 출시했습니다.

올해 초 Anthropic은 Anthropic이 출시하기에는 너무 위험하다고 판단한 고급 사이버 보안 기능을 갖춘 새로운 모델인 Claude Mythos의 한정 출시를 발표했습니다.

회사는 Fable 5가 지금까지 출시된 모델 중 가장 유능한 모델이며, 소프트웨어 엔지니어링, 지식 작업, 비전 및 과학 연구 전반에 걸쳐 테스트된 거의 모든 벤치마크를 주도하고 있다고 밝혔습니다. Anthropic은 작업이 더 복잡할수록 이전 모델 및 경쟁사에 비해 Fable 5의 우위가 더 넓어진다고 말합니다.

다음도 참조하세요:

주요 소프트웨어 버그를 찾는 AI의 능력은 매년 490% 성장하고 있습니다.

Fable 5는 Project Glasswing을 통해 사이버 보안 파트너와 공유되는 제한된 버전인 Claude Mythos 5와 동일한 기본 아키텍처를 공유하지만 민감한 쿼리를 가로채서 Claude Opus 4.8로 라우팅하는 분류기와 함께 제공됩니다. 제한된 범주에는 사이버 보안, 생물학, 화학뿐만 아니라 경쟁 시스템에서 사용하기 위해 모델의 기능을 추출하려는 시도도 포함됩니다.

Anthropic은 시스템이 보수적으로 조정되어 있으며 때때로 양성 요청에 플래그를 지정한다는 점을 인정하지만 세션의 5% 미만만이 폴백을 트리거한다고 말합니다.

Claude Fable 5를 사용해 보는 방법

Fable 5는 현재 Claude-fable-5 모델 문자열을 사용하는 API를 통해 모든 Claude 요금제에서 사용할 수 있습니다. 가격은 입력 토큰 백만 개당 10달러, 출력 토큰 백만 개당 50달러입니다. 이는 Claude Mythos Preview 비용의 절반 미만입니다. 구독 계획 사용자는 6월 22일까지 추가 비용 없이 액세스할 수 있으며 그 이후에는 사용 크레딧이 필요합니다.

벤치마크

Anthropic에 따르면 에이전트 코딩 평가에서 Fable 5는 GPT-5.5와 Claude Opus 4.8을 상당한 차이로 앞섰습니다. 회사의 데이터에 따르면 일부 주요 벤치마크에서는 Claude Mythos보다 성능이 더 뛰어난 것으로 나타났습니다.

AI 벤치마크에서 Claude Fable 5의 성능을 보여주는 표


크레딧: Anthropic

Anthropic은 블로그 게시물에서 Fable 5에 조기 액세스한 핀테크 회사 Stripe이 이 모델이 하루 만에 5천만 줄의 Ruby 코드베이스 전체 마이그레이션을 완료했다고 보고했다고 썼습니다. Anthropic은 전체 엔지니어링 팀이 이 작업을 수행하려면 2개월 이상이 소요될 것이라고 추정했습니다.

우화 5, 신화 5, 그리고 안전

여기서의 안전 이야기는 정말 복잡합니다. Anthropic은 Mythos급 모델이 일반 출시에 너무 위험하다고 경고하는 데 몇 달을 보냈습니다. 최근 5월에 회사는 이전 Mashable 보고에 따라 적절한 보호 장치가 아직 존재하지 않는다는 사실을 공개적으로 인정했습니다.

Fable 5는 이 문제에 대한 답변이지만 회사 자체 공개에 따르면 이 솔루션은 아직 진행 중인 작업입니다. 외부 버그 현상금은 범용 탈옥을 생성하지 않고 1,000시간 이상의 테스트를 실행했습니다. 그러나 영국 AI 안전 연구소는 짧은 초기 창에서 이를 조기에 진행했습니다. 인류학적 프레임은 허용 가능한 위험으로 간주됩니다. 다른 사람들은 동의하지 않을 수도 있습니다.

Fable 5 시스템 카드에는 이 모델이 Claude Opus 4.8 및 환각, 부정직, 아첨과 같은 잘못된 행동에 대한 기타 최신 모델과 유사한 성능을 가지고 있다고 명시되어 있습니다.

주제
인공지능 인류학

공식 정보 바로가기

자세한 정보 확인

관련 기사

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다