(사진=지니언스)
(사진=지니언스)

중국 정부의 지원을 받는 해커들이 앤트로픽의 인공지능(AI) 모델 '클로드'를 사이버 공격에 악용한 사실이 드러났다. 

앤트로픽은 최근 중국 정부 배후로 추정되는 해킹 그룹이 지난 9월 정부기관과 대형 정보기술(IT) 기업, 금융기관, 화학제조기업 등 30여 곳을 상대로 침투를 시도해 일부 성공했다고 밝혔다. 표적이 된 기업이나 피해를 입은 기업·기관이 어디인지는 공개되지 않았다. 

해커들은 앤트로픽 AI 코딩 어시스턴트인 '클로드 코드'를 활용했다고 한다. 사이버 공격은 인간의 개입 없이 대부분 작업을 AI를 통해 진행됐다. 해커들은 자동화된 공격 방법으로 기업이나 기관의 데이터를 수집한 것으로 드러났다. 

앤트로픽은 이를 인간의 개입 없이 실행된 첫 사이버 공격 사례로 규정했다. 제이콥 클라인 앤트로픽 위협 정보 책임자는 "해커들은 전체 공격의 80~90%가 자동화됐고, 인간보다 빠르게 공격을 수행했다"라며 "말 그대로 버튼 한 번만 누르면 공격이 시작됐고, 인간은 핵심 단계에서 지시하거나 확인하는 역할만 했다"라고 말했다. 

기사의 이해를 돕기 위해 AI 도구로 제작한 이미지. (사진=AI포스트 DB)
기사의 이해를 돕기 위해 AI 도구로 제작한 이미지. (사진=AI포스트 DB)

AI 모델들은 사이버 공격과 같은 불법 행위를 방지하는 안전 장치가 탑재돼 있다. 그러나 해커들은 합법적인 보안 회사 직원을 가장해 '침입 방어 테스트'를 진행한다며 AI를 속였다고 한다. 앤트로픽은 의심스러운 활동을 감지하자마자 조사에 착수했다. 

앤트로픽은 이후 10일 동안 계정을 차단하고 관련 기관에 해당 사실을 통보했다. 한편 앤트로픽의 AI 모델을 불법 행위에 악용한 건 이번이 처음이 아니다. 앤트로픽은 지난 8월 자사의 클로드 모델이 해킹에 악용되고 있으며, 북한 공작원들이 외화벌이 수단으로까지 이용하고 있다고 밝혔다. 

앤트로픽이 공개한 8월 위협 인텔리전스 보고서에 따르면 클로드는 해커들의 의해 의료, 응급 서비스, 정부 및 종교 기관을 포함해 최소 17개 기관을 대상으로 한 대규모 사이버 범죄에 사용됐다. 해커들은 에이전틱 코딩 도구를 이용해 민감한 기록들을 빼내 갔다. 

해커들은 피해자들에게 50만 달러가 넘는 자금을 요구하기 위해 데이터를 공개하겠다고 위협했다고 한다. 특히 어떤 데이터를 유출할지, 금품 요구 조건을 어떻게 작성할지 등 전술적, 전략적 결정을 내리는 데 AI 모델 클로드가 활용됐다. 앤트로픽은 해당 작전을 발견하자마자 문제의 계정을 차단했다.

앤트로픽은 "저희는 모델의 이러한 유해한 사용을 탐지하고 완화하는 방법을 지속적으로 개선하기 위해 최선을 다하고 있다"라고 밝혔다. 

AI포스트(AIPOST) 진광성 기자 aipostkorea@naver.com