OpenAI는 사이버 보안이라는 이름으로 겉으로는 악의적인 프롬프트를 기꺼이 받아들일 수 있는 새로운 AI 모델인 GPT-5.4-Cyber를 공개했습니다. 다행스럽게도 ChatGPT 개발자는 제한이 덜하고 자유분방한 AI를 아무나 플레이하도록 허용하지 않습니다.
Anthropic의 Claude Mythos는 대단한 스턴트인가요, 아니면 실제 보안 위협인가요? 전문가들이 말하는 것.
화요일 블로그 게시물을 통해 발표된 GPT-5.4-Cyber는 OpenAI가 공개적으로 사용 가능한 GPT-5.4 대규모 언어 모델의 변형입니다. OpenAI에 따르면 GPT-5.4와 같은 최첨단 AI 모델은 명백한 악의적인 사용으로부터 보호 기능을 갖추고 있어 자격 증명 도용이나 코드의 취약점 찾기와 같은 유해한 사용자 요청을 거부합니다. 이와 대조적으로 회사의 새로운 GPT-5.4-Cyber 모델은 보다 관대하게 훈련되었으며 잠재적으로 이러한 프롬프트를 대신 받아들입니다.
GPT-5.4-Cyber를 “사이버 허용”이라고 설명하는 OpenAI는 이번 변경으로 연구원이 해결해야 할 취약점을 찾는 데 도움이 되는 등 방어적인 사이버 보안 조치에 AI를 사용할 수 있다고 밝혔습니다.
OpenAI는 “우리는 사이버 보안을 위해 맞춤 제작된 모델을 포함하여 최전선 기능에 대한 광범위한 액세스를 제공함으로써 방어자에게 힘을 실어주고 싶습니다”라고 밝혔습니다. “이것은 합법적인 사이버 보안 작업에 대한 거부 경계를 낮추고 고급 방어 워크플로를 위한 새로운 기능을 활성화하는 GPT‑5.4 버전입니다.”
GPT-5.4-사이버의 낮아진 안전 장치로 인한 잠재적인 위험을 고려할 때, 모든 사람이 AI의 유연한 윤리적 한계를 훨씬 더 밀어붙이기 위해 즉시 뛰어들 수는 없을 것입니다. OpenAI는 “검증된 보안 공급업체, 조직 및 연구원에 대한 제한적이고 반복적인 배포”로 시작한다고 밝혔습니다. 따라서 현재 TAC(Trusted Access for Cyber) 프로그램 회원에게만 GPT-5.4-Cyber에 대한 액세스 권한이 부여되며, 가장 높은 등급에 있는 회원에게만 액세스 권한이 부여됩니다.
매쉬 가능한 광속
지난 2월 선보인 TAC는 정부 신분증 확인 등 OpenAI의 자동화된 신원 확인 과정을 거친 사용자들의 네트워크다. 승인되면 OpenAI의 TAC 프로그램 사용자는 GPT‑5.4‑Cyber와 같이 보호 장치가 적은 AI 모델 버전에 액세스할 수 있습니다. OpenAI는 이것이 사이버 보안 연구, 교육 및 프로그래밍을 가능하게 하기 위한 것이라고 말합니다.
그러나 모든 TAC 승인 사용자가 즉시 GPT-5.4-Cyber를 손에 넣을 수 있는 것은 아닙니다. OpenAI는 아직 TAC의 상위 계층에 속하지 않은 사용자가 이에 대한 액세스를 요청할 수 있으며, 이를 위해서는 “합법적인 사이버 방어자”임을 확인하기 위해 추가 인증을 거쳐야 한다고 밝혔습니다.
GPT-5.4-Cyber의 공개는 OpenAI 경쟁자인 Anthropic이 Project Glasswing을 발표한 지 불과 일주일 만에 이루어졌습니다. TAC와 마찬가지로 Project Glasswing은 Anthropic의 사이버 보안에 초점을 맞춘 Claude Mythos Preview AI 모델을 승인된 조직을 선택하도록 제한하는 이니셔티브입니다. Anthropic은 Claude Mythos Preview가 “심각도가 높은 수천 개의 취약점을 이미 발견했다”고 주장하면서 Project Glasswing이 자사의 AI 모델이 방어적인 사이버 보안 목적으로만 사용되도록 하기 위한 노력이었다고 밝혔습니다.
Anthropic은 “AI 발전 속도를 고려할 때 이러한 기능이 잠재적으로 안전하게 배포하려는 행위자를 넘어 확산되기까지는 그리 오래 걸리지 않을 것”이라고 썼습니다.
공개: Mashable의 모회사인 Ziff Davis는 2025년 4월 OpenAI가 AI 시스템 교육 및 운영에 있어 Ziff Davis의 저작권을 침해했다고 주장하며 OpenAI를 상대로 소송을 제기했습니다.