Claude Mythos와 Project Glasswing은 PR 스턴트인가요? 전문가들이 무게를 두고 있습니다.

Anthropic은 지난 주 전례 없는 발표를 통해 기술 세계 전체를 주목했습니다. Anthropic은 AI 모델을 너무 발전시켜 대중에게 공개하기에는 너무 위험했습니다. Anthropic은 새로운 개척 언어 모델인 Claude Mythos Preview가 “사이버 보안을 재구성”할 것이라고 말했습니다.

Anthropic은 또한 Claude Mythos Preview를 테스트하고 인프라를 보호하기 위해 Anthropic의 가장 큰 경쟁사를 포함한 초대 전용 조직 그룹인 Project Glasswing의 결성을 발표했습니다.

Anthropic은 Claude Mythos Preview가 “몇 가지를 포함하여 심각도가 높은 수천 개의 취약점을 발견했습니다. 모든 주요 운영 체제 및 웹 브라우저.” (원본에서 강조) 회사는 “세계에서 가장 중요한 소프트웨어를 보호하는 데 도움을 주기 위해” Project Glasswing이 필요하다고 말했습니다.

금요일까지 CNBC는 제롬 파월 연방준비은행 의장과 스콧 베센트 재무장관이 새로운 모델에 관한 긴급 회의를 위해 금융 고위 성직자(일명 은행 CEO)를 소집했다고 보도했습니다. 뉴욕 타임즈 작가 토마스 프리드먼(Thomas Friedman)은 클로드로 무장한 십대라면 누구나 지역 전력망을 해킹할 수 있는 “무서운” 미래에 대해 초조해했습니다.

Claude Mythos Preview에 대한 반응은 예측 가능한 선을 따라 빠르게 나누어졌습니다. AI 부스터들은 새로운 모델을 인공 일반 지능(AGI)이 가까워졌다는 증거로 환영하며 Anthropic이 이 모델을 책임감 있게 출시했다고 칭찬했습니다.

비평가들과 AI 회의론자들은 Project Glasswing을 대규모 홍보 활동이라고 불렀습니다.

그래서 그것은 어느 것입니까?

이를 확인하기 위해 Mashable은 Anthropic의 주장을 검토하고 AI 및 사이버 보안 전문가와 대화를 나눴습니다.

클로드 미토스 프리뷰란 무엇인가요?

Claude Mythos는 특히 사이버 보안 분야에서 세계 최고의 AI 모델 중 하나로 널리 간주되는 Claude Opus 4.6보다 훨씬 더 나은 성능을 발휘한다고 Anthropic이 밝힌 새로운 대규모 언어 모델입니다.

Claude Mythos 시스템 카드에는 “우리 테스트에서 Claude Mythos Preview는 주요 운영 체제와 웹 브라우저에서 제로데이 취약점을 자동으로 발견하고 이용하는 기능을 포함하여 이전 모델에 비해 사이버 기능이 눈에 띄게 향상되었음을 보여주었습니다.”라고 적혀 있습니다.

클로드 미토스(Claude Mythos)는 AGI의 징후인가요?

인공일반지능(Artificial General Intelligence)은 광범위한 작업에서 인간보다 더 나은 성능을 발휘할 수 있는 초지능 AI를 의미합니다. Anthropic, Google, Meta, xAI 및 OpenAI가 새로운 군비 경쟁에 수천억 달러를 쏟아부으면서 우리 경제 전체가 AGI 추구를 중심으로 조직되었다고 해도 과언이 아닙니다.

Claude Mythos가 Anthropic이 말하는 것처럼 능력이 있다면 AGI의 예가 될까요? 모델 카드는 이 질문을 직접적으로 다루고 있으며 Anthropic은 그것이 AGI에 가깝다고 생각하는 것 같습니다.

Claude Mythos 안전 위험에 대한 섹션에서 Antropic은 다음과 같이 썼습니다. “현재 위험은 여전히 ​​​​낮습니다. 그러나 기능이 계속해서 빠르게 발전한다면(예: 강력한 초인적 AI 시스템 수준까지) 위험을 낮게 유지하는 것이 주요 과제가 될 수 있다는 경고 신호가 보입니다.” 물론 Anthropic은 이러한 믿음을 장려하기 위한 강력한 재정적 인센티브를 가지고 있습니다.

Claude Mythos의 벤치마크 성능 비교

이 차트는 여러 벤치마크를 하나로 결합한 ECI 점수에서 Mythos가 이전 Anthropic 모델과 어떻게 비교되는지 보여줍니다.
크레딧: Anthropic

궁극적으로 Claude Mythos의 모델 카드는 온라인에서 제안하는 반응보다 더 보수적입니다.

예를 들어 Claude Mythos 모델 카드는 하다 이 모델이 이전 Anthropic 모델의 추세선보다 높은 성능을 발휘한다는 것을 보여주었고 Anthropic은 그렇다고 말합니다. ~ 아니다 자기 개선이나 반복적 성장의 증거를 보여줍니다. (“우리가 식별할 수 있는 이점은 AI 지원이 아니라 인간 연구에서 비롯된 것이라고 확신합니다.”)

Project Glasswing이 홍보 활동이라고 생각하는 이유

나에게 표지판을 탭하게 하지 마세요: “(언제) AI 세일즈맨이 AI가 농업 혁명에 따라 세상을 바꿀 수 없는 기술이라고 말할 때… 당신은 이 예측을 그것이 무엇인지, 즉 판매 홍보로 받아들여야 합니다.”

저는 Anthropic CEO Dario Amodei가 AI의 잠재적인 대격변적 위험에 대해 경고한 에세이에 대한 응답으로 이러한 경고의 말을 썼습니다. Anthropic은 또한 AI 모델에 대해 심각한 경고를 발행한 이력이 있습니다.

당신은 회사 CEO가 꺼지는 것을 막기 위해 회사 CEO를 “협박”하려 했던 인류 모델의 이야기를 기억할 것입니다. 실제로 Anthropic은 협박이 잠재적인 결과가 될 수 있는 테스트 환경을 설계했습니다. 이는 실제 모델의 잘못된 행동이라기보다는 디지털 함정에 더 가깝습니다.

그렇다면 클로드 미토스(Claude Mythos)가 업계 치킨 리틀 문제의 최신 사례일까요?

X에서 AI 안전 엔지니어인 Heidy Khlaaf는 Anthropic의 주장에 의문을 제기하는 공개 질문을 나열했습니다.

Anthropic은 Claude Mythos 미리보기에서 수천 개의 제로데이 취약점을 발견했다고 밝혔습니다. 그러나 Khlaaf는 Anthropic이 이 주장을 평가하는 데 필요한 주요 사실(오탐률, Claude Mythos가 기존 사이버 보안 도구와 비교하는 방법, 사람의 수동 검토가 얼마나 필요한지 등)을 생략했다고 말합니다.

Khlaaf는 Mashable에 “Anthropic의 주장을 입증하는 데 필요한 증거를 명확하게 모호하게 하는 의도적으로 모호한 언어로 마케팅 게시물을 공개하는 것은 그들이 추가 투자를 얻으려고 시도하고 있는지 의문을 제기합니다”라고 말했습니다. “또한 전문가의 주장을 검증할 수 있는 능력조차 모호하게 만들 때 독립적인 평가를 위한 제한적인 공개라도 공개 공개가 부족하다는 점을 공공 서비스로 규정할 수 있기 때문에 ‘안전 제일’ 이미지를 제공합니다.”

우리는 이러한 우려에 대해 Anthropic에 반복적으로 연락했지만 회사는 응답하지 않았습니다. 그렇다면 이 문서를 업데이트하겠습니다. Claude Mythos 시스템 카드에서 Anthropic은 Mythos가 발견한 버그가 패치되고 수정됨에 따라 앞으로 몇 주 안에 더 많은 데이터가 공개될 것이라고 썼습니다.

AI 전문가이자 저자이자 LLM 과대 광고 기계의 유명한 비평가인 Gary Marcus는 처음에 Mashable에 Claude Mythos가 새로운 유형의 위협을 나타내는지 여부를 알기에는 너무 이르다고 말했습니다.

그러나 Marcus는 우리가 그와 이야기를 나눈 이후 더욱 회의적이었으며 최근 X에 Mythos가 처음에 보였던 것처럼 “무서운 곳이 전혀 없었다”고 썼습니다. “여러분, 안심하세요. 신화는 기하급수적인 추세에서 벗어나는 이득이 아닙니다.”라고 그는 썼습니다.

사이버 보안 전문가들은 Mashable에 Claude Mythos가 “조명을 끄거나” 중요한 인프라를 무너뜨리는 데 사용될 가능성은 거의 없다고 말했습니다.

“Mythos의 재앙적인 사용에 대한 주장은 위협 모델, 사이버 보안 위험 및 실제로 안전에 중요한 사고로 이어질 수 있는 방식으로 위험을 전파하는 능력을 크게 오해하고 있습니다.”라고 Khlaaf는 말했습니다. “모델에게 ‘이 시스템을 해킹하라’고 요청하는 것만큼 간단하지 않습니다. Anthropic의 자체 기술 블로그 게시물은 Anthropic이 마케팅 게시물에서 경시하는 필수 전문 지식을 보여줍니다.”

다른 전문가들은 회의적인 입장을 표명하는 동시에 Mythos가 진정한 위험을 나타낸다는 점을 인정했으며 Marcus도 이에 대해 말했습니다.

스탠포드 AI 연구원이자 AGI, Inc.의 설립자인 Div Garg는 “공개 발표가 필요하지 않다고 주장할 수도 있습니다.”라고 말했습니다.
“그러나 궁극적으로 중요한 소프트웨어를 개발하고 유지 관리하는 사람들에게만 액세스를 제한하기로 한 결정은 정확히 그러한 시나리오에서 기업이 수행하기를 원하는 것입니다. 제한된 액세스를 비판하기는 쉽지만 확인하지 않고 출시하면 더 나쁜 결과가 발생할 수 있습니다.”

사이버 보안 회사인 Remedio의 창립자이자 CEO인 Tal Kollender는 Mashable과의 인터뷰에서 Claude Mythos와 같은 도구는 발견을 악용할 수 있기 때문에 위험하다고 말했습니다.

“훌륭한 기업 극장입니다.”라고 Kolender가 말했습니다. “모델에 ‘대중에게 공개하기에는 너무 위험하다’는 라벨을 붙이는 것은 확실히 마케팅 유연성입니다. 왜냐하면 이는 즉각적으로 신비로움을 불러일으키고 투자자에게 엄청난 힘을 실어주기 때문입니다. 그러나 PR 스턴트 이면에는 매우 현실적이고 매우 평범한 진실이 있습니다. 사이버 보안 산업에는 실제로 ‘발견’ 문제가 없습니다. 우리는 이미 취약점을 탐지하는 도구에 빠져들고 있습니다. Mythos가 하는 일은 전례 없는 규모로 발견 프로세스를 자동화하는 것입니다.”

요약: Claude Mythos Preview를 공개한 지 일주일 후, 이 모델에 대한 Anthropic의 가장 큰 주장 중 일부는 훨씬 더 개략적으로 보인다고 전문가들은 말합니다. 그러나 그들은 Claude Mythos 및 이와 유사한 다른 도구가 실제 위험을 초래한다는 점도 인정합니다.

그럼에도 불구하고 새로운 프론티어 모델에 대해 긴장할 만한 매우 타당한 이유가 많이 있습니다.

클로드 미토스 미리보기를 생각하는 이유 ~이다 글로벌 사이버 보안에 대한 진정한 위협

에서 뉴욕 타임즈작가 토마스 프리드먼(Thomas Friedman)은 곧바로 시나리오를 떠올립니다. 전쟁 게임십대가 방과 후 지역 전력망을 해킹하는 곳입니다.

그 시나리오는 일주일 후에 훨씬 더 터무니없는 것처럼 보입니다. 그러나 훨씬 더 가능성이 높은 시나리오는 다음과 같습니다. 정교한 해커 그룹이 Claude Mythos와 같은 도구를 사용하여 디지털 인프라에서 제로 데이 취약점을 찾아 조직이 대응할 수 있는 것보다 더 빠르게 공격을 시작합니다.

그리고 그 시나리오는 당신을 걱정할 것입니다.

Claude Mythos가 이를 수행할 수 있는 도구가 아니라면 대부분의 전문가들은 그러한 도구가 멀지 않다는 데 동의합니다.

그리고 세계 최고의 사이버 보안 전문가 중 일부는 확실히 걱정하는 것 같습니다.

Anthropic 및 Google DeepMind에 소속된 연구 과학자인 Nicholas Carlini는 Project Glasswing 웹 사이트의 비디오에서 “지난 몇 주 동안 (Claude Mythos와 함께) 내 남은 인생 전체를 합친 것보다 더 많은 버그를 발견했습니다.”라고 말했습니다.

Carlini는 “Linux에서 권한이 없는 사용자가 내 컴퓨터에서 일부 바이너리를 실행하기만 하면 관리자로 권한을 승격할 수 있는 여러 가지 취약점을 발견했습니다.”라고 말했습니다.

이번 주 AI 보안 연구소는 Claude Mythos의 기능에 대한 조사 결과를 발표했으며 이것이 진정한 도약을 의미한다는 독립적인 검증을 제공합니다.

사이버 보안 테스트에 대한 Claude Mythos의 성능을 보여주는 차트

AISI는 영국 정부 과학기술부 산하 연구기관입니다.
크레딧: AISI

Claude Mythos는 다른 어떤 모델도 완료하지 못한 사이버 보안 테스트를 통과했으며 거의 ​​모든 테스트에서 다른 프론티어 모델보다 높은 점수를 받았습니다.

“우리의 테스트에 따르면 Mythos Preview는 보안 상태가 취약한 시스템을 이용할 수 있으며 이러한 기능을 갖춘 더 많은 모델이 개발될 가능성이 높습니다.”라고 AISI는 결론지었습니다.

AISI는 또한 실제 시나리오에서 효율성을 저하시킬 수 있는 Claude Mythos의 몇 가지 제한 사항을 확인했습니다.

그렇다면 Anthropic의 Mythos 출시는 책임 있는 AI 관리였습니까 아니면 이기적인 마케팅이었습니까? 제가 인터뷰한 전문가들은 이러한 옵션이 상호 배타적이지 않다고 말했습니다.

“나는 그것이 둘 다라고 말하고 싶습니다. 그리고 그것은 비판이 아닙니다”라고 Xu는 말했습니다. “이 시대의 모든 주요 플랫폼 출시는 청중의 유창함과 두려움에 대한 내성에 따라 서로 다르게 보일 것입니다. 제가 관심을 갖는 것은 그 의도가 진짜인지 여부이며, Anthropic에서 본 증거는 그것이 대부분임을 암시합니다.”

공포를 불러일으키는 AI 헤드라인이 흔히 그렇듯이, 현실은 더욱 복잡한 것으로 드러났습니다.

Gen의 최고 AI 및 혁신 책임자인 Howie Xu는 “개인적으로 저는 Mythos를 사용하는 어린이가 전력망을 해킹하는 것에 대해 걱정하면서 잠자리에 들지 않습니다. 그러나 이것이 그 우려가 허구라는 것을 의미하지는 않습니다.”라고 말했습니다. “우리는 이러한 도구의 창의적이고 협업적인 장점이 엄청나고 보안 인프라가 이를 따라잡지 못하는 변곡점에 있습니다. 바로 그 격차가 나를 바쁘게 만드는 이유입니다. 심각한 사고가 발생할 가능성이 아주 조금이라도 너무 높기 때문에 에이전트 시대에 신뢰와 보안 계층을 구축하는 것이 나의 최대 초점입니다.”

마지막으로 Anthropic이 Claude Mythos 모델 카드에서 강조한 것처럼 이와 같은 도구는 장기적으로 해커보다 사이버 보안 방어자에게 더 큰 도움이 될 것입니다. 그리고 단기적으로는 Project Glasswing을 모델로 한 접근 방식과 같은 보다 신중한 접근 방식이 필요할 수 있습니다.

요약: Claude Mythos는 강력한 사이버 보안 코딩 능력을 보유하고 있으며 이는 진정한 위협을 나타냅니다. 그러나 해커가 Claude Mythos와 같은 AI 도구에 액세스할 수 있다면 조직도 그러한 공격을 방어할 수 있습니다.

주제
인공지능

관련 기사

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다