"이미지 이해·처리 동급 최강"…AI 기업 코히어, '아야 비전' 모델 출시

2025-03-05     유진 기자
(사진=코히어)

생성형 인공지능(AI) 스타트업 코히어(Cohere)가 텍스트와 이미지를 동시에 이해하는 복잡한 멀티모달 작업에 특화된 최첨단 비전 모델을 공개했다. 

코히어는 기업용 생성형 AI를 개발하는 기업으로 구글 브레인 출신의 아이단 고메즈와 닉 프로스트, 캐나다의 기업가 이반 장이 2019년 창업했다. 코히어는 비영리 연구소인 '코히어 포 AI'를 운영하며, 텍스트를 이해하고 분석하기 위한 다국어 모델과 같은 오픈 소스 모델을 출시하고 있다.

코히어는 4일(현지시간) 공식 블로그를 통해 최첨단 비전 AI 모델인 '아야 비전(Aya Vision)'을 출시했다고 밝혔다. 아야 비전이 이미지에 포함된 미묘한 뉘앙스까지 포착할 수 있는 모델이라고 코히어 측은 밝혔다. 

(사진=코히어)

아야 비전 모델은 이미지 설명과 더불어 질의응답, 텍스트 생성 등 작업에서 우수한 성과를 보인다고 한다. 예를 들어 사용자가 여행 중에 본 예술 작품 이미지를 첨부하면 AI가 작품에 어떤 스타일이 적용됐고 어느 ​​지역에서 유래했는지를 알려준다. 

아야 비전 모델은 320억개의 매개변수를 보유한 '아야 비전 32B'와 80억개의 매개변수를 갖고 있는 '아야 비전 8B'로 구성돼 있다. 아야 비전 32B 모델의 경우 시각적 이해 능력을 평가하는 벤치마크에서 메타의 라마-3.2 90B 비전 등 경쟁 모델들보다 높은 점수를 기록했다고 한다. 

두 모델 모두 AI 개발 플랫폼 허깅 페이스에서 사용할 수 있다. 다만 상업적 용도로는 사용할 수 없다. 코히어는 아야 비전 모델을 개발하는 과정에서 합성 데이터를 활용한 것으로 전해졌다. 더 적은 자원으로 경쟁력 있는 모델을 더 빠르게 개발할 수 있다는 이유에서다. 

(사진=코히어)
(사진=코히어)

코히어 측은 "아야 비전은 23개 언어에서 탁월한 성과를 거두고 다른 주요 오픈소스 모델을 능가하는 최첨단 다국어 모델인 아야 익스팬스(Aya Expanse)의 성공을 기반으로 제작됐다"라며 "진전을 가속화하기 위해 전 세계 연구자들과 적극적으로 협력하고 있다"라고 밝혔다. 

한편 코히어는 지난해 12월 100개 이상의 언어를 지원하는 AI 검색 기반 모델인 리랭크 3.5를 출시한 바 있다. 코히어의 리랭크는 검색 정확도를 높여주는 역할을 하는 AI 모델이다. 기존 검색 엔진은 키워드를 찾아 결과를 보여준다. 

반면 리랭크는 실제 검색어의 의미를 이해하고 질문과의 관련성에 따른 결과에 순위를 매긴다. 기존 검색 시스템을 보완하는 역할을 한다. 최근 아랍어에 특화된 모델도 개발했다. 중동 시장을 본격적으로 공략하겠다는 전략이다. 코히어는 자사의 모델이 아랍어, 중국어, 프랑스어, 일본어와 같은 주요 비즈니스 국가의 언어에 강점이 있다고 밝혔다.