"귄 있네, 가가 가가?" 사투리 알아 듣는 '한국형 챗GPT' 하이퍼클로바X가 대박인 이유
한국어에 특화된 AI 대화형 챗봇 '하이퍼클로바X'가 출시됐는데, 그야말로 대박이라는 반응이 나오고 있습니다. 검색의 제왕 '구글'도 장악하지 못하는 시장이 있죠.
바로 대한민국인데요. 네이버가 버티고 있기 때문인데, 과연 생성형 AI 시장에서도 그 지위를 유지할 수 있을까요. 지난달 네이버가 한국형 거대언어모델인 AI '하이퍼클로바X'를 공개한 거 아시나요?
그동안 챗GPT나 구글 바드를 사용하시면서 다소 아쉬운 점이 많으셨을텐데요. 이를테면 한국어로 질문했을 때 어색한 대답을 한다거나 틀린 답을 능청스럽게 하기도 하잖아요. 하이퍼클로바X는 한국어로 된 데이터를 학습했어요.
그러니까 한국인에게 특화된 언어모델 서비스가 출시된 거죠. 한국어에 대한 이해도가 어느 정도인지 알아보기 위해 흥미로운 테스트를 진행해봤습니다. 사투리를 입력해보고 알아들을 수 있는지, 의미에 대한 이해가 정확한지에 대해서 말이죠.
SNS에서 인기를 끌었던 사투리 능력 고사있잖아요. 지역별로 몇 가지 문항을 넣어봤어요. 경상도 문제부터 물어봤는데, '가가 가가'라는 말 있잖아요. 경상도에서 그 사람이 아까 그 사람이었어? 라는 뜻으로 쓰인다는데 클로바X는 어떻게 답했을까요?
클로바X는 정확한 뜻을 이야기했구요. 상황을 예시로 들어서 설명해주는 친절함까지 겸비했더라구요. 사투리 고사에 나오는 '아이씨예~ 여 좀 널짜주이소'라는 말도 넣어봤어요. 이번에도 정답을 맞췄고, 말의 유래까지 설명해줬습니다.
다음은 전라도 사투리에 대해 물어봤습니다. '포도시'라는 단어가 담긴 문장을 줘봤는데, 이 말은 전라도에서 '간신히'라는 뜻으로 통한다고 하는데요. 클로바X는 어떻게 답했을까요? 간신히, 겨우, 가까스로라는 의미를 가진 부사라고 정확히 설명했구요, 누구나 이해할 수 있게 예시를 들어 부연했습니다.
'귄있다'라는 표현도 물어봤어요. 전라도에서는 자주 쓰이는 말이라고 하는데, '귀염성스럽다'의 방언이라고 대답했습니다. 문장으로 예를 들어 쓰임새를 알려달라고 요청했더니 전라도 사투리에다 '귄있게'라는 말을 적절히 넣어서 생성하는 모습도 볼 수 있었습니다.
다음은 충청도 문제를 내봤는데요. '여둔눠', '거 다시 잘 낌어놔' 등 충청도 사람이 아니면 알기 어려운 문제도 척척 풀어냈습니다. 끝으로 난이도가 가장 높다는 제주도 사투리로 테스트를 해봤는데요. '벨롱벨롱'이라는 뜻 아시나요? 저도 영상을 준비하며 처음 들어봤는데, '대롱대롱'이라는 뜻인가 싶었는데 '반짝반짝'을 의미한다고 합니다.
클로바X의 답은 어땠을까요? 이번에도 클로바X는 정답을 정확히 이야기했구요, 심지어 같은 발음의 프랑스어까지 소개해줬습니다. 전라도 문항에 나왔던 '포도시'라는 단어로 챗GPT에 비슷한 질문을 해봤는데, 클로바X는 '간신히'라는 뜻을 정확히 맞췄잖아요? 이와 달리 챗GPT는 비판적으로 나타내거나 어이 없다는
의미라고 하면서 터무니없는 대답을 내놓았습니다. 사투리로 몇 가지 실험을 해봤는데, 역시 네이버가 한국어 데이터에 특화됐다는 점을 알 수 있었고요. 다만 현재 대기 등록을 해야 사용할 수 있고,
서비스 오류가 종종 발생해 불편함을 느낀다는 분들이 많은데, 11월 편의성을 높인 버전이 나온다고 하니까 아마 한국인 이용자는 기하급수적으로 늘어나지 않을까 예상됩니다.