카나나, 글로벌 최고 수준 한국어·영어 성능 보유
다양한 혁신적 학습 방법 적용해 학습 비용 문제 해결

(사진=카카오)
(사진=카카오)

카카오가 자체 AI 모델을 기반으로 기술력 검증과 생태계 확장에 나선다. 

카카오(대표이사 정신아)는 언어모델 라인업 중 국내 AI 생태계 활성화를 위해 ‘Kanana Nano 2.1B’ 모델을 오픈소스로 깃허브(GitHub)에 배포했다. 

‘Kanana Nano 2.1B’의 베이스 모델과, 인스트럭트(Instruct) 모델, 임베딩(Embedding) 모델이 오픈소스 커뮤니티인 깃허브를 통해 제공된다. 카카오의 AI 모델은 '카나나'라는 브랜드 아래 언어모델(LLM) 3종(△플래그 △에센스 △나노)과 멀티모달 언어모델(MLLM) 3종(△카나나-오 △카나나-브이 △카나나-에이), 비주얼 생성모델 2종(△칼리지 △키네마)과 음성모델 2종(△카브 △카스트)으로 전체 라인업을 구성했다.

‘Kanana Nano 2.1B’는 연구자와 개발자가 활용하기 적절한 크기의 모델이자 온디바이스(On-device) 환경에서도 활용 가능한 고성능의 경량 모델로, 비교적 작은 규모임에도 유사한 크기의 글로벌 모델에 견줄 만한 성능을 자랑한다. 

지난달 카카오 공식 테크블로그를 통해 공개한 바와 같이, 한국어와 영어 처리 능력에서 뛰어난 결과를 보여준다. 카카오는 이번 오픈소스 공개를 통해 AI 기술의 접근성을 높이고자 하며, 연구자와 개발자들이 해당 모델을 토대로 다양한 응용을 시도할 수 있도록 모델의 업데이트를 지속 지원할 계획이다.

카카오 김병학 카나나 성과리더는 “모델 최적화와 경량화 기술을 바탕으로 라마, 젬마 등 글로벌 AI 모델과 견줄 수 있는 고성능의 자체 언어모델 라인업을 효율적으로 확보하게 됐으며, 이번 오픈소스 공개를 통해 국내 AI 생태계 활성화에 기여할 수 있을 것으로 기대한다”라고 밝혔다. 

이어 김병학 성과리더는 “앞으로도 효율과 성능 중심의 실용적이고 안전한 AI 모델을 개발해가며, 지속적 기술 혁신을 통해 AI 경쟁력을 강화해 갈 계획”이라고 덧붙였다.

카카오는 향후 '카나나' 모델에 강화 학습과 연속 학습 기반의 최신 기술을 접목해 추론, 수학, 코딩 능력을 강화하고 정렬 기술을 고도화해 이용자의 요청에 대한 수행 정확도를 높일 계획이다. 

이를 통해 음성, 이미지, 영상 등 다양한 형태로 소통할 수 있도록 모델 고도화를 이어가며 일상에 실질적인 가치를 더하는 기술로 자리 잡을 수 있도록 기술 경쟁력을 강화한다는 방침이다.

AI포스트(AIPOST) 조형주 기자 aipostkorea@naver.com