"더 인간처럼 말한다"…오픈AI, 챗GPT 고급 음성 대화 기능 업데이트

2025-06-10     유진 기자
(사진=오픈AI)

챗GPT 개발사 오픈AI가 챗GPT의 음성 대화 기능을 업데이트했다. 더 다양한 감정과 자연스러운 억양을 구사할 수 있다는 게 특징이다. 

오픈AI는 챗GPT 유료 사용자들에게 제공되는 실시간 음성 대화 기능인 '고급 음성 모드(Advanced Voice Mode)'를 업데이트했다고 발표했다. 음성의 억양과 자연스러움이 크게 향상돼 상호작용이 더욱 자연스럽고 사람처럼 느껴질 것이라는 설명이다. 

오픈AI는 "더욱 자연스러운 음성, 더욱 섬세한 억양, 사실적인 운율, 공감, 비꼬는 말 등 특정 감정 표현에 대한 더욱 정확한 표현력을 제공한다"라고 밝혔다. 챗GPT의 '고급 음성 모드'는 오픈AI가 지난해 출시한 음성 대화가 가능한 모델인 'GTP-4o'의 업데이트 버전이다.

언어 번역 기능도 향상됐다. 언어 간 번역을 요청하기만 하면 중지 또는 전환을 지시할 때까지 대화 내내 번역을 해준다. 예를 들어 레스토랑에서 영어 문장으로 주문하면 AI가 포르투갈어로 바꿔준다. 

(사진=오픈AI)

이어 종업원이 포르투갈어로 답변하면 AI가 영어로 바꿔주는 방식이다. 한국어를 비롯 50여 개 언어의 사용을 개선해 자연스러운 대화를 주고 받을 수 있다. 향상된 기능은 모든 시장 및 플랫폼의 챗GPT 유료 사용자에게 제공된다. 오픈AI는 "오디오 품질에 약간의 저하가 있을 수 있다"라고 말했다. 

한편 오픈AI와 경쟁 중인 앤트로픽과 구글도 음성 모드를 제공 중이다. 클로드에 도입된 음성 대화 모드는 구글 제미나이 라이브, 오픈AI 챗GPT 음성 모드처럼 사용자와 AI가 음성으로 대화할 수 있도록 지원하는 기능이다. 음성으로 대화하며 화면에는 핵심 내용이 표시된다. 

구글도 개인 맞춤형 AI 어시스턴트인 제미나이 라이브를 서비스 중이다. 제미나이 라이브는 이용자의 요구에 따라 실시간으로 대화하고 협력해 사용할 수 있는 혁신적인 대화형 AI 기술이다. 한국어도 지원한다. 구글은 정교한 AI 어시스턴트 경험을 지속 제공할 계획이다.