[AI실험실] "초보 며느리도 AI 도움으로 '잡채' 만든다"…GPT-4 멀티모달 기능 어디까지 써봤니?
AI 활용 '요리 독학' 가능해져…한식도 만들 수 있나? 멀티모달 기능으로 조리 방법, 참고 사진까지 생성해
최근 세계 최대 클라우드 기업인 아마존웹서비스(AWS)가 생성형 인공지능(AI) 기반의 '멀티모달 거대언어모델(LLM)' 시장에 뛰어든다는 소식이 전해졌다. 멀티모달은 텍스트뿐만 아니라 이미지, 음성, 비디오 등 어떠한 데이터도 AI가 인식하고, 생성해 낼 수 있는 모델을 의미한다.
오픈AI는 일찌감치 멀티모달 기능을 내놓은 바 있다. 지난달에는 더욱 강화된 모델을 공개해 서비스하고 있다. 이미지나 음성, 영상을 인식하고 변환하는 수준이라고 생각한다면 큰 오산이다. 최근 커뮤니티에서 멀티모달 기능을 이용한 다양한 콘텐츠들이 쏟아지고 있다. 멀티모달 기능을 더욱 이롭게 활용할 수 있는 노하우를 전하기 위해 AI포스트가 몇 가지 실험을 진행했다.
"잡채 만드는 법 알려줘. 따라 할 수 있게 그림으로도 부탁해~"
텍스트를 이미지로 만들 수 있기 때문에 요리 공부도 AI와 함께 할 수 있을 것으로 판단, 이 같은 실험을 진행했다. 블로그나 요리책을 찾아보는 초보 며느리들에게 도움이 될 수 있는 수준인지 알아보기 위해 질문을 던졌다. '잡채를 만드는 방법에 대해 상세히 알려줘'라는 명령을 내렸다.
일단 음식을 잡채로 특정한 데에는 이유가 있다. 잡채는 명절 잔치상에 빠지지 않는 요리다. 당면, 야채, 버섯 등 다양한 재료를 섞어 만든다. 특히 재료로 사용되는 야채들은 따로 손질을 해야 하기 때문에 난이도가 높은 음식으로 꼽히기 때문이다. '요알못(요리를 알지 못하는 사람)'이 쉽게 만들 수 없는 음식이다.
요리법을 묻는 질문에 AI의 답변은 어땠을까. 결과는 당연히 만족할 만한 수준으로 도출됐다. 최근 언어모델들의 경우 질문을 하면 주요 사이트를 찾고, 이를 기반으로 대답하기 때문에 정확도가 높다는 평가다. 물론 한계라고 지적돼 왔던 환각 현상도 눈에 띄게 줄어들고 있는 셈이다. 재료와 조리 방법을 상세히 풀어냈다.
대답만 보더라도 따라 할 수 있을 정도였다. 그러면서 챗GPT는 "각 재료를 별도로 볶는 것이 잡채의 맛을 살리는 비결입니다. 맛있는 요리되시길 바랍니다"라는 응원의 메시지도 건넸다. 요리를 배울 때 순서에 따른 참고사진이 필요하다. 이에 '조리 과정을 사진으로 요약해줘'라는 질문을 던졌다. 요리 초보자들이 멀티모달 기능의 효과를 누릴 수 있는지 확인하기 위함이다.
이에 몇 초도 지나지 않아 AI는 잡채 조리법이 담긴 그림을 그려냈다. 당면을 물에 불리고 얇게 채 썬 채소들을 볶는 모습도 담겼다. 볶은 채소와 소고기, 당면을 한 그릇에 모아 섞는 그림도 볼 수 있었다. 사람이 정성스럽게 작성한 블로그 글, 직접 찍은 조리 과정 사진 등과 비교해 만족할 수 없지만, 프롬프트를 AI와 주고받다 보면 더욱 양질의 결과물을 얻을 수 있을 것으로 예상된다.
"김치 담그는 법 AI에게 배워요"
김장철을 맞아 '김치 담그는 법'에 대해서도 AI에게 물어봤다. 이에 챗GPT는 "김장김치는 한국의 대표적인 겨울저장식품으로, 양배추와 다양한 야채를 사용하여 만듭니다"라며 운을 뗐다. 이어 배추, 소금, 무, 대파, 마늘 등 주요 재료들을 열거했다.
조리 방법을 5단계로 구분해 설명했다. 배추를 절이고, 찹쌀풀을 만드는 방법, 양념을 만드는데 필요한 재료 등을 소개했다. 그러나 김치는 글로만 보고 배워 만들 수 있는 음식이 아니다. 그만큼 난이도가 높기 때문에 실제 처음 김장을 하는 초보 며느리들은 유튜브 영상을 참고해 만든다고 한다. 김치 담그는 과정을 사진으로 제작해 달라는 명령도 내려봤다.
비교적 제조 과정을 잘 요약한 '잡채'와는 달리 김치의 제조 과정은 몇 차례 프롬프트를 주고받는 것으로 만족할 만한 결괏값을 얻어내지 못했다. 김치 담그는 법에 대한 학습이 부족한 탓인지, 혹은 프롬프트의 완성도가 낮은 탓인지 제대로 된 사진을 얻을 수 없었다. 다양한 모델에 멀티모달 기능이 탑재되면서 앞으로도 새로운 시도들이 활발해질 것으로 전망된다.