"메타 라마 뛰어넘었다"…알리바바, 고도의 '추론·코딩' 능력 가진 AI 모델 출시
알리바바가 고도의 추론·코딩 능력을 갖춘 인공지능(AI) 모델을 19일(현지시간) 발표했다. 더불어 알리바바는 자체 대규모언어모델(LLM)인 Qwen 2.5 모델 중 100개 이상을 글로벌 오픈소스 커뮤니티에 출시했다고 밝혔다.
알리바바 클라우드는 이날 앱사라 컨퍼런스 2024(Apsara Conference 2024)에서 Qwen 2.5 모델을 발표했다. 견고한 AI 컴퓨팅에 대한 증가하는 수요를 충족하도록 설계된 풀스택 인프라를 공개했다.
새롭게 출시된 오픈소스 Qwen 2.5 모델은 매개변수가 0.5~720억개에 이른다. 수학 및 코딩 기능이 향상됐으며, 29개 이상의 언어를 지원한다. 자동차, 게임, 과학 연구 등 다양한 분야에 걸쳐 엣지 또는 클라우드에서 광범위한 AI 애플리케이션을 처리할 수 있다.
Qwen 모델 시리즈는 지난해 4월 처음으로 공개된 이후 개발자들에게 인기를 끌고 있다. 오픈소스로 제공되는 Qwen 모델은 허깅 페이스와 같은 플랫폼에서 4000만건 이상 다운로드됐다. Qwen 2.5 모델 중 100개 이상의 모델이 오픈 소스로 제공된다고 알리바바 클라우드는 밝혔다.
여기에는 언어 이해, 오디오, 비전, 수학 등 분야에서 특화된 모델들이 포함돼 있다. 알리바바 클라우드는 자사의 독점적 플래그십 모델인 Qwen-Max도 업그레이드됐다고 발표했다. 향상된 Qwen-Max 모델은 언어 이해 및 추론, 수학, 코딩과 같은 분야에서 다른 최첨단 모델과 동등한 성능을 보여준다고 알리바바 측은 설명했다.
알리바바는 Qwen-Max 모델이 메타의 라마와 같은 경쟁 모델의 성능을 능가했다고 강조했다. 또 알리바바는 AI 모델을 기반으로 한 텍스트-비디오 생성 도구도 출시했다. 사용자가 텍스트로 상황을 설명하면 AI가 이를 기반으로 비디오를 만든다.
알리바바 클라우드 인텔리전스의 최고 기술 책임자인 징렌 저우(Jingren Zhou)는 "가장 광범위한 오픈소스 이니셔티브를 출시하는 중요한 이정표"라며 "개발자와 기업에 힘을 실어 AI 기술을 활용하는 능력을 향상시키고 오픈소스 커뮤니티의 성장을 자극할 것"이라고 말했다.