Anthropic은 2026년에 엄청난 속도로 제품을 출시하고 뉴스를 만들어 왔으며 목요일에 AI 회사는 Claude Opus 4.7의 출시를 발표했습니다.
Claude Opus 4.7은 일반 대중이 이용할 수 있는 Anthropic의 가장 지능적인 모델입니다. 특히 Anthropic은 보도 자료에서 Opus 4.7이 ~ 아니다 Anthropic이 공개하기에는 너무 위험하다고 간주한 Claude Mythos만큼 강력합니다.
Claude Opus는 다단계 추론과 고급 코딩이 가능한 하이브리드 추론 모델 제품군입니다. 4월 7일 Claude Mythos가 발표될 때까지 Claude Opus는 Anthropic의 가장 진보된 AI 모델 시리즈로 간주되었습니다.
최신 기사를 놓치지 마세요. Mashable을 Google에서 신뢰할 수 있는 뉴스 소스로 추가하세요..
Claude Opus 4.7을 사용해 보는 방법
Claude Opus 4.7은 현재 Claude AI, Claude API 및 Microsoft Foundry와 같은 Anthropic 파트너를 통해 제공됩니다. 새 모델의 가격은 Claude Opus 4.6과 동일합니다.
Anthropic은 ‘불안한’ 연구 논문에서 AI를 의인화하는 사례를 제시합니다.
그러나 Anthropic은 “Opus 4.7은 더 높은 노력 수준에서 더 많은 것을 생각하기 때문에” 이전 버전보다 더 많은 출력 토큰을 사용한다고 지적했습니다. 사용자는 Opus 4.7 마이그레이션 가이드에서 토큰 사용을 최적화하는 방법에 대해 자세히 알아볼 수 있습니다.
Claude Opus 4.7이 4.6보다 향상된 방법
예상대로 Claude Opus 4.7은 전반적으로 향상된 기능을 제공합니다.
특히 Anthropic은 Claude Opus 4.7이 고급 코딩 작업, 시각적 지능 및 문서 분석에 더 뛰어나다고 말합니다. Anthropic은 또한 Opus 4.7이 “전문적인 작업을 완료하고 고품질 인터페이스, 슬라이드 및 문서를 생성할 때 더욱 세련되고 창의적”이라고 말합니다.
매쉬 가능한 광속
“사용자들은 이전에 면밀한 감독이 필요했던 가장 어려운 코딩 작업을 확신을 가지고 Opus 4.7에 맡길 수 있다고 보고합니다. Opus 4.7은 복잡하고 장기간 실행되는 작업을 엄격하고 일관성 있게 처리하고 지침에 세심한 주의를 기울이고 다시 보고하기 전에 자체 출력을 확인하는 방법을 고안합니다.”라고 Anthropic 블로그 게시물을 읽습니다.
Claude Opus 4.7: 벤치마크 성능
Anthropic은 Claude Opus 4.7이 OpenAI, Google 및 xAI의 다른 Anthropic 모델 및 프론티어 모델과 어떻게 비교되는지 설명하는 자세한 모델 카드를 출시했습니다.
Opus 4.7은 출시되지 않은 Claude Mythos보다 뒤떨어져 있습니다. Anthropic은 Humanity’s Last Exam과 같은 일반적인 벤치마크에서 상당히 높은 점수를 받았다고 보고합니다. 모델 카드에는 “Claude Opus 4.7은 우리가 측정한 모든 관련 축에서 Claude Mythos Preview보다 성능이 떨어지며 우리의 역량 한계를 발전시키지 못합니다.” 즉, Claude Opus 4.7은 AI 개발이 기존 추세선을 넘어 가속화되었다는 증거가 아니라는 의미입니다.
AI 산업에는 큰 치킨 리틀 문제가 있다
~에 인류의 마지막 시험 (도구 없이) Anthropic은 Claude Opus 4.7이 Claude Mythos를 제외한 다른 모든 개척 모델보다 성능이 뛰어나다고 보고합니다.
-
Claude Mythos는 HLE에서 56.8%를 기록했습니다.
-
Claude Opus 4.7은 46.9%를 기록했습니다.
-
Gemini 3.1 Pro는 44.4%를 기록했습니다.
-
GPT-5-4 Pro 점수 42.7%
-
Claude Opus 4.6은 40.0%를 기록했습니다.
도구의 경우 GPT-5-4-Pro는 58.7%를 기록했고 Opus 4.7은 54.7%를 기록했습니다. Mythos는 64.7%로 둘 다 이겼습니다.
Mashable은 이러한 벤치마크 결과를 독립적으로 검증하지 않았습니다. 전체 결과는 Opus 4.7 모델 카드에서 확인할 수 있습니다.

크레딧: Anthropic
전반적으로 Anthropic은 일부 벤치마크에서 다른 주요 모델보다 Opus 4.7을 기록했지만 일부 영역에서는 Gemini 3.1 Pro 및 GPT-5-4가 더 높은 점수를 받았습니다.
클로드 오푸스 4.7: 안전과 환각
Anthropic은 또한 Opus 4.7이 Opus 4.6과 유사한 위험 프로필을 가지고 잘못된 행동의 위험이 낮다고 보고합니다.
예를 들어, Anthropic은 Opus 4.7이 환각을 일으킬 가능성이 적고 보상 해킹 비율이 더 낮다고 말합니다.
“Claude Opus 4.7은 Opus 4.6 또는 Sonnet 4.6보다 더 신뢰할 수 있고 정직하며 중요한 누락 비율이 크게 감소하고 사실성 및 환각 입력 비율이 약간 향상되었습니다.”라고 모델 카드에 명시되어 있습니다.
기술을 최대한 활용하는 방법에 대해 더 자세히 알고 싶으십니까? Mashable의 주요 뉴스 및 할인 뉴스레터에 가입하세요 오늘.