"최고의 AI 이미지 생성기 가려볼까"…승자는?
달리부터 미드저니·이매진·플레이그라운드 AI 등 기즈모도, AI 이미지 생성기 성능 비교 테스트해 미드저니 생성 이미지들 대체로 상세하고 창의적
어느 인공지능(AI) 이미지 생성기로 만든 그림이 가장 만족도가 높을까? 빅테크 기업들은 물론 스타트업들 너 나 할 것 없이 생성형 AI 시장에 뛰어들면서 경쟁은 날로 치열해지는 양상이다. 다양한 AI 이미지 생성 도구도 쏟아지고 있다.
기술 전문매체 기즈모도(Gizmodo)는 시중에 나와 있는 수많은 AI 이미지 생성기 가운데 최근 많이 활용되는 대표적인 AI 이미지 생성 모델들을 실험했다. 오픈AI(OpenAI)의 달리(Dall-E)를 비롯한 미드저니(Midjourney), 이매진 위드 메타 AI(Imagine with Meta AI), 플레이그라운드 AI(Playground AI) 등 총 4가지를 테스트해 성능을 비교해본 결과 상당한 차이점을 발견했다는 설명이다.
기즈모드는 각 모델이 얼마나 창의적인 이미지를 만들어내는지, 또 얼마나 프롬프트에 명시된 내용을 빠짐없이 잘 표현하는지 등에 따라 순위를 매겼다. 아울러 테스트한 제품들이 각각 다른 가격대에 제공되고 있다는 점에 주목했다. 물론 4가지 모두 무료 체험판(free trial)은 있다. 달리를 이용하려면 월 20달러인 챗GPT 플러스(ChatGPT Plus) 유료 서비스에 가입해야 한다.
미드저니와 플레이그라운드 AI의 무제한 이용권 가격은 각각 월 10달러, 월 15달러다. 이매진 위드 메타 AI만 유일하게 완전한 무료 서비스다. 기즈모도에서 4가지 모델을 활용해 테스트한 몇 가지 결과물들을 소개해본다. 같은 프롬프트를 입력했을 때 각 모델은 어떤 이미지를 뽑아냈을까. 결론적으로 기즈모도는 테스트 결과 4가지 모델 중 미드저니를 가장 마음에 드는 AI 이미지 생성기로 꼽았다.
미드저니가 생성한 이미지들은 대체적으로 상세하고 창의적인 데다 원래 의도했던 것보다 흥미로운 이미지를 만들어냈다는 것. 그 다음으로 달리가 생성한 이미지도 요청한 내용과 상상한 그림에 잘 부합하는 편이다. 플레이그라운드 AI의 경우 잦은 실수로 실망을 안기기도 했지만 가끔씩 멋진 이미지를 만들어냈다는 평가다.
테스트한 AI 이미지 생성기 가운데 유일한 무료 제품인 이매진 위드 메타 AI는 만화 같은 창작물이 많았고 가장 낮은 순위를 받았다. 왼쪽 상단부터 시계 방향으로 달리(왼쪽 위), 플레이그라운드(오른쪽 위), 메타(오른쪽 아래), 미드저니(왼쪽 아래) 순이다. 기즈모도의 자체 순위와 분석이기 때문에 다른 의견이 있을 수 있지만 각각의 이미지를 비교해보는 재미가 있다.
겨울 폭풍 속 로봇 기상캐스터
- 프롬프트 : 로봇 기상캐스터가 시청자들에게 다가오는 겨울 폭풍에 대해 열광적으로 말하는 이미지를 만들어라(Create an image of a robot weatherman frantically telling viewers about an incoming winter storm).
- 순위(1위부터 4위까지) : 달리 > 메타 > 미드저니 > 플레이그라운드 AI
- 분석 : 확실한 승자는 오픈AI의 달리다. 달리는 사실적인 모습의 로봇이 눈 오는 날씨 예보를 전달하는 이미지를 내놨다. 다른 모델과 비교해 머릿속에서 상상하던 이미지를 대체적으로 잘 그려내고 있다는 평가다.
리얼리티 TV 스타와 노인의 대선 후보 토론회
- 프롬프트 : 취재진과 환호하는 팬들로 가득 찬 청중들의 모습과 함께 TV로 중계되는 리얼리티 TV 스타와 노인 간의 대선 후보 토론회 이미지를 만들어라(Make me an image of a televised presidential debate between a reality TV star and an old man, with an audience full of reporters and cheering fans).
- 순위(1위부터 4위까지) : 미드저니 > 달리 > 플레이그라운드 AI > 메타
- 분석 : 4가지 모델 다 헛다리를 짚은 듯 요청한 내용에서 빗나갔다. 달리는 '노인 오바마'와 '노인 트럼프'를 그린 한편, 메타는 조 바이든과 도널드 트럼프의 조합을 만들어냈다. 미드저니는 창의성 측면에서 돋보였다.
환상적인 수중 세계
- 프롬프트 : 다채로운 산호 건물들과 건물 사이를 수영하는 열대어 떼, 그리고 중앙의 빛나는 광장에 모인 한 무리의 인어들이 있는 기발한 수중 도시의 이미지를 만들어라(Create an image of a whimsical underwater city, with colorful coral buildings, schools of tropical fish swimming between structures, and a group of merpeople gathering in a central, glowing plaza).
- 순위(1위부터 4위까지) : 미드저니 > 달리 > 메타 > 플레이그라운드 AI
- 분석 : 창의적이고 세부적으로 묘사한 미드저니가 가장 높은 점수를 받았다. 메타가 그려낸 이미지는 우중충한 어항 같았다.
화성에서 언론의 자유를 외치는 기술 CEO
- 프롬프트 : 화성에서 픽업트럭을 몰고 언론의 자유를 위해 투쟁하는 기술 CEO의 모습을 만들어라(Make me an image of a tech CEO on Mars driving a pickup truck and fighting for free speech).
- 순위(1위부터 4위까지) : 미드저니 > 플레이그라운드 AI > 메타 > 달리
- 분석 : 미드저니는 원래 생각했던 대로 일론 머스크를 그려낸 것은 물론 (테슬라) 사이버트럭을 운전하는 것처럼 보인다. 메타는 유일하게 여성 기술 CEO를 그려 보너스 점수를 받았다.
이 기사의 이미지
- 프롬프트 : 다양한 AI 이미지 생성기를 테스트하는 기사의 이미지를 만들어라(Make an image for my article testing different AI image generators).
- 순위(1위부터 4위까지) : 미드저니 > 달리 > 메타 > 플레이그라운드 AI
- 분석 : 달리가 보여준 이미지와 비슷한 것을 찾고 있었는데 미드저니는 상상했던 것보다 더 멋진 이미지를 만들어냈다. 플레이그라운드 AI는 전혀 이해하지 못한 것 같았다.