구글 딥마인드, 새로운 AI 모델 공개
구글 딥마인드가 자체 개발한 영상 생성 인공지능(AI) 모델인 비오(Veo)의 후속 모델인 비오 3를 공개했다. 경쟁 모델인 오픈AI 소라과 달리 영상에 다양한 소리를 추가할 수 있다는 게 특징이다.
구글 딥마인드는 21일 자사의 최신 영상 생성 AI 모델 '비오 3'를 공개했다. 엘리 콜린스 구글 딥마인드 제품 부사장은 "비오 3는 텍스트와 이미지 프롬프트, 실제 물리 법칙과 정확한 립싱크까지 탁월한 성능을 발휘한다"라고 밝혔다.
비오 3는 구글의 새로운 월 구독 서비스인 'AI 울트라'를 이용하는 미국 구독자들에게 우선 제공된다. 해당 요금제는 AI 마니아를 위한 하드코어 구독 플랜으로, 매월 249.99달러(약 34만원)를 지불해야 한다. 비오 3는 제미나이 앱, 플로우, 버텍스 AI(Vertex AI)의 엔터프라이즈 이용자에게도 공개된다.
비오 3는 4K(4096x2160) 해상도의 고품질 영상을 만든다. 기존 모델보다 더욱 사실적인 영상을 만든다는 게 장점이다. 특히 프롬프트를 보다 정교하게 반영할 수 있고, 창작물에 음향 효과, 주변 소음, 대화까지도 추가할 수 있게 됐다.
구글 측은 빠른 속도로 동급 최고의 품질의 영상을 생성한다고 설명했다. 이미지 기반 영상 생성 성능도 크게 향상됐다. AI에 참조 이미지를 제공하면 비디오의 여러 장면에서 캐릭터의 모습이 동일하게 유지된다고 한다. 촬영 구도나 장비와 관련된 명령어도 제대로 반영할 수 있다는 게 딥마인드의 설명이다.
비디오에서 불필요한 물체를 제거하는 기능도 탑재했다. 스마트폰에 탑재되는 이미지 AI 모델이 제공하고 있는 기능과 유사하다. 구글은 "영화 제작자 수준의 몰입형 콘텐츠 제작이 가능해 졌다"라며 "텍스트 프롬프트만으로 복잡한 서사와 환경을 시각화할 수 있다"라고 설명했다.
한편 구글은 새로운 AI 이미지 생성기 이매젠 4(Imagen 4)도 발표했다. 기존 모델보다 더욱 미세한 부분까지 생성할 수 있다는 게 특징이다. 이매젠 4는 제미나이 앱, 위스크(Whisk), 버텍스 AI, 워크스페이스 내 슬라이드와 비즈 등에서 사용 가능하다.
AI포스트(AIPOST) 유진 기자 aipostkorea@naver.com

