AI 저작권 분쟁 계속될 듯…美 작가그룹 "저커버그, 불법 복제물 알고도 승인"
챗GPT 등장 이후 본격화된 '저작권 분쟁'이 올해도 계속 이어질 전망이다. 이에 자체 언어모델을 개발하는 기업들이라면 인공지능(AI) 학습 데이터에 대해 적법한 권한을 확보하는 것이 중요해지고 있다.
이 가운데 마크 저커버그 메타 CEO가 불법 복제된 데이터셋이라는 것을 알면서도 인공지능(AI) 모델 학습에 사용하도록 승인했다는 의혹이 제기됐다.
10일(현지시간) 가디언 등 외신보도에 따르면 전미도서상을 수상한 미국 작가 타네히시 코츠, 코미디언 사라 실버맨 등을 포함한 작가 그룹은 미국 캘리포니아 북부지방법원에 이같은 내용의 소송 문제를 제출했다.
이 작가 그룹은 메타 최고경영자인 마크 저커버그가 불법 복제된 것으로 알려진 AI 학습 데이터셋 '립젠(LibGen)'을 AI 모델 훈련에 사용하도록 승인했다라고 주장하며 고소했다. 립젠은 논문, 수백만 권의 소설, 논픽션 도서 등을 불법으로 다운로드할 수 있는 아카이브로 알려져 있다.
작가들은 지난해에도 메타를 고소한 바 있다. 대규모 언어 모델인 라마(Llama)를 훈련하는 과정에서 자신들의 책을 무단으로 활용했다고 주장한 바 있다. 그러나 빈스 차브리아 캘리포니아 지방법원 판사는 메타가 저작권을 침해했다는 원고 측의 주장을 기각했다.
제기한 소송이 기각되자 작가들은 법원에 주장을 수정할 수 있는 허가를 받았다. 이에 작가들은 새로운 문서에 메타 내부 직원들이 립젠이 불법이라는 것을 알고도 사용했다는 점을 포함시켰다.
차브리아 판사는 작가들이 수정한 소장을 제출하는 것을 허용한다고 말했지만, 새롭게 추가된 사기 혐의와 CMI 청구의 타당성에 대해서는 회의적인 견해를 표명했다. 메타 측은 자신들이 사용한 학습 데이터와 관련, '공정 사용 원칙' 입장을 고수하고 있다.
한편 오픈AI도 여러 언론사, 작가 그룹과 저작관 관련 소송을 진행 중이다. 뉴욕타임스, 시카고트리뷴, 뉴욕데일리뉴스, 캐나다 언론사 5곳 등 언론사들은 오픈AI와 마이크로소프트가 수백만 개의 기사를 허가 없이 사용했다고 주장하고 있다.