무비 젠 모델로 만든 AI 영상 갈무리. (사진=메타)
무비 젠 모델로 만든 AI 영상 갈무리. (사진=메타)

페이스북 모회사 메타 플랫폼(이하 메타)이 동영상 생성 인공지능(AI) 모델 '무비 젠(Movie Gen)'을 공개했다. 텍스트 프롬프트만으로 16초 분량의 영상을 만들 수 있다는 게 특징이다. 

메타는 4일(현지시간) 공식 블로그를 통해 동영상 생성 AI 모델인 '무비 젠'을 소개했다. 300억(30B) 매개변수로 구성된 무비 젠은 초당 16프레임의 속도로 최대 16초 분량의 비디오를 생성할 수 있다. 객체 동작, 주체-객체 상호 작용 및 카메라 동작에 대해 추론할 수 있다. 

기존 동영상을 편집할 수 있고, 오디오를 생성할 수도 있다. 사진과 텍스트 프롬프트를 결합해 맞춤형 영상을 만들 수도 있다. 특히 원본 콘텐츠를 보존하면서 관련 픽셀만 수정할 수 있어, 매우 정밀하게 영상을 제작할 수 있다. 이날 메타는 무비 젠을 활용해 생성한 샘플 영상을 공개했다.  

(그래픽=메타)
(그래픽=메타)
(사진=메타)
무비 젠 모델로 만든 AI 영상 갈무리. (사진=메타)
(사진=메타)
(사진=메타)

영상에는 하마가 물 속을 헤엄치고, 코알라가 서핑을 즐기며, 펭귄이 옷을 입고 걷는 모습이 담겼다. 오픈AI의 소라 모델로 제작한 영상과 비교해도 완성도 측면에서 뒤지지 않는 수준이다. 

다만 무비 젠 모델 출시 시점은 공개되지 않았다. 메타의 최고제품책임자인 크리스 콕스는 자신의 SNS를 통해 "아직 비용이 많이 들고 세대별 생성 시간도 길기 때문에 회사는 아직 무비 젠을 제품으로 출시할 준비는 되어 있지 않다"라고 했다. 

'무비 젠'은 일부 영화 제작자를 포함한 소수의 파트너에게 우선 제공된다. 이를 통해 메타는 모델을 개선해 나갈 예정이다. 메타가 본격적으로 영상 생성 AI 시장에 뛰어들면서 구글, 오픈AI와의 경쟁이 치열해질 것으로 전망된다. 

(그래픽=메타)
(그래픽=메타)
(그래픽=메타)
(그래픽=메타)

한편 구글은 지난 5월 AI 동영상 생성 모델인 '비오(Veo)'를 공개했다. 텍스트, 이미지와 프롬프트를 통해 비디오를 생성하는 모델이다. 디테일한 장면을 생성하거나 시네마틱 효과를 적용하는 데 장점이 있다. 

오픈AI는 올해 2월 AI 동영상 모델인 '소라'를 공개한 바 있다. 현재까지 가장 높은 성능을 보유하고 있는 것으로 알려졌다. 중국 기업들의 약진도 두드러지고 있다. 중국 콰이쇼우의 '클링', 성수 테크놀로지의 '비두(Vidu)'도 업계의 관심을 받고 있다. 

AI포스트(AIPOST) 유진 기자 aipostkorea@naver.com