문서·이미지·영상 정보 처리 가능…NC AI, 멀티모달 AI '바르코 비전 2.0' 4종 공개

2025-07-16     조형주 기자
(사진=엔씨소프트)

엔씨소프트의 인공지능(AI) 연구조직 엔씨 AI(NC AI)가 16일 멀티모달 AI 모델 ‘바르코 비전 2.0’ 시리즈 4종을 오픈소스로 공개했다. 

바르코 비전 2.0은 이미지, 텍스트를 동시에 이해하고 질문에 답할 수 있는 멀티모달 AI 모델이다. 기존 모델보다 한국 문화 이해도와 텍스트 생성 능력이 향상됐다는 설명이다. 

이번에 공개된 모델은 ▲14B ▲1.7B ▲1.7B-OCR ▲멀티모달 임베딩 등 4종이다. 14B 모델과 임베딩 모델이 이날 먼저 공개됐다. 나머지 2종은 다음 주 순차 출시될 예정이다. 

(사진=엔씨소프트)

엔씨 AI는 오픈소스 텍스트 모델을 기반으로 추가학습을 통해 멀티모달 모델을 구축했다. 4종은 텍스트와 이미지, 영상 정보를 이해하는 차세대 모델로 한국어 특화 성능과 글로벌 경쟁력을 갖췄다는 평가다.

14B 모델은 InternVL3-14B, Ovis2-16B, Qwen2.5-VL 7B 등 글로벌 VLM(비전언어모델)을 다양한 벤치마크에서 능가했다. 특히 복잡한 문서나 표, 차트를 동시에 분석할 수 있는 점이 강점으로 꼽힌다.

OCR 모델은 다양한 해상도의 이미지를 분할 입력 방식으로 처리하며 흐릿하거나 혼합 언어 환경에서도 높은 인식률을 보였다. 임베딩 모델은 텍스트·이미지·영상 간 의미 유사도를 분석해 고성능 검색 기능을 구현했다.

(사진=엔씨소프트)

4종 모델은 클라우드뿐 아니라 개인 디바이스에서도 사용 가능하다. 금융, 교육, 제조, 콘텐츠 등 다양한 분야에 적용될 수 있다. 보고서·계약서 등 문서 자동 처리와 비디오 검색, 광고 문구 생성 등에 활용될 전망이다. 

엔씨 AI는 이번 모델 공개를 통해 국내 AI 기술의 자주성과 접근성을 동시에 높일 계획이다. 이연수 엔씨 AI 대표는 “글로벌 트렌드가 텍스트만 처리하는 언어 모델에서 비전언어모델로의 전환이 가속화되고 있다”며 “이번 공개는 국내 AI 기술의 주권과 경쟁력을 입증한 사례”라고 말했다.