(사진=ETH Zurich)
(사진=ETH Zurich)

스위스 대학 연구진이 자체 개발한 대규모언어모델(LLM)인 아페르투스(Apertus)를 오픈소스로 공개했다. 보다 신뢰할 수 있는 AI 모델을 찾는 사용자들에게 대안이 될 수 있을 것으로 기대된다. 

외신보도에 따르면 스위스 로잔 연방 기술 연구소(EPFL)와 취리히연방공과대학(ETH Zurich), 스위스 국립 슈퍼컴퓨팅 센터(CSCS)가 공동 개발한 LLM 아페르투스는 완전히 개방적으로 설계된 AI 모델로, 1000개 이상의 언어에 걸쳐 15조 개의 토큰을 사용해 학습됐다. 

현재 80억 개와 700억 개의 매개변수를 가진 두 가지 크기로 제공되고 있다. 연구진은 작은 모델은 개인이 사용하기에 적합하며, 두 모델 모두 오픈소스 라이선스에 따라 배포돼 교육 및 연구뿐 아니라 광범위한 사회 및 상업적 응용 분야에서도 사용할 수 있다고 밝혔다. 학습 데이터의 40%는 독일어, 로만슈어를 포함한 영어 외 언어로 구성됐다. 연구진은 AI 모델 학습에 공개적으로 이용 가능한 데이터만 사용했다고 밝혔다. 

(사진=ETH Zurich)
(사진=ETH Zurich)

LLM 프로젝트의 기술 책임자이자 취리히 연방공과대학 연구원인 이마놀 슐라그(Imanol Schlag)는 "아페르투스는 공익을 위해 설계됐다. 이 규모로 완전히 개방된 LLM 중 몇 안 되는 사례이며, 다국어 지원, 투명성, 규정 준수를 기본 설계 원칙으로 구현한 최초의 사례"라고 말했다.

연구진은 아페르투스의 학습 과정에 대한 포괄적인 설명 문서와 소스 코드, 사용된 데이터셋도 함께 공개했다. 스위스 데이터 보호법 및 저작권법을 준수하도록 아페르투스를 개발했기 때문에 유럽 규정을 준수하려는 기업에게는 더 나은 선택이 될 수 있다는 설명이다. 

스위스 은행협회는 이전에 스위스 자체 LLM이 스위스의 엄격한 현지 데이터 보호 및 은행 비밀 유지 규정을 더 잘 준수할 수 있기 때문에 '장기적으로 큰 잠재력'을 가질 것이라고 밝혔다. 현재 스위스 은행들은 필요에 따라 다른 AI 모델을 사용 중이다. 

(사진=ETH Zurich)
(사진=ETH Zurich)

연구진은 "수십억 달러 규모의 예산을 가진 미국 기업들과 경쟁하려는 것이 아니다"라고 주장했다. 스위스 연방 공과대학 로잔 EPFL의 머신 러닝 교수인 마틴 재기는 "신뢰할 수 있고, 자주적이며, 포용적인 AI 모델을 개발하는 방법에 대한 청사진을 제공하는 것이 우리의 목표"라고 말했다.

아페르투스는 오픈소스로 공개돼 누구나 편하게 사용해볼 수 있다. 연구원, 취미 활동가, 기업까지도 아페르투스를 기반으로 각자의 필요에 맞게 조정할 수 있다. 챗봇, 번역기, 교육·훈련 도구도 제작 가능하다. 몇몇 연구자들은 이미 건강, 교육, 기후 분야의 프로젝트를 모색하고 있다고 한다. 

스위스 AI 이니셔티브 공동 책임자인 앙투안 보셀뤼는 "아페르투스 출시는 개방적이고 신뢰할 수 있으며, 자주적인 AI 기반 구축을 위한 장기적인 노력의 시작"이라며 "스위스 개발자들이 모델을 활용하는 모습을 기대한다"라고 강조했다. 

AI포스트(AIPOST) 진광성 기자 aipostkorea@naver.com