AI가 '짖는 소리'만 듣고 우리 개 '감정·품종' 알아낸다

미시간 대학 연구진, '개 짖는 소리'로 감정 분석하는 AI 개발 '개 짖는 소리', '인간 음성+짖는 소리' 두 가지 데이터 활용 인간 음성에 짖는 소리 학습시킨 AI 모델, 분석 정확도 높아 "인간의 말에서 파생된 소리·패턴, 동물 이해하는 기초될 수 있어"

2024-06-07     유진 기자
(사진=미시간 대학)

사람과 말이 통하지 않는 반려견들은 아픈 곳이 있어도 어떻게 아픈지 제대로 표현하지 못한다. 반려견 보호자들은 전전긍긍하다가 병원을 찾는다. 이럴 때마다 '말이 통한다면 더 잘 보살펴줄 수 있을텐데'라고 생각하는 보호자들이 많다. 

'짖는 소리'를 분석해 개의 감정과 성별, 품종 등을 알아내는 인공지능(AI) 모델이 개발했다. 미국 미시간 대학은 4일(현지시간) 대학 내 연구원들이 멕시코 국립 천체물리학 연구소, 광학 및 전자 연구소 등과 함께 동물의 발성에서 데이터를 수집하고 분석할 수 있는 AI 모델을 개발했다고 발표했다. 

미시간 대학 AI 연구소 소장인 라다 미할체아(Rada Mihalcea)는 "우리와 이 세상을 공유하는 동물에 대해 아직 모르는 것이 너무 많다. AI의 발전은 동물과의 의사소통에 대한 우리의 이해를 혁신하는 데 사용될 수 있다"라고 밝혔다. 

동물의 발성을 분석할 수 있는 AI 모델을 개발하는 데 있어 가장 큰 장애물 중 하나는 공개적으로 사용 가능한 데이터가 부족하다는 것이다. 해당 연구는 최첨단 AI 음성 모델 ‘Wav2Vec2’를 활용해 특정한 '짖는 소리' 뒤에 감춰져 있는 개의 감정과 성별, 품종을 식별한다는 것이 핵심이다. 연구진들은 AI 학습을 위해 두 개의 데이터 세트를 사용해 결과를 비교했다.

하나는 개 짖는 소리로만 AI 모델을 훈련시킨 것이고, 다른 하나는 인간의 음성으로 사전 훈련된 모델에 개 짖는 소리로 미세 조정한 데이터다. 그 결과 약 1000시간 분량의 인간 음성을 사전 훈련시킨 이후 개 짖는 소리를 접목한 모델이 더 나은 성능을 보였다. 

(사진=이디오그램)

연구진은 사람 음성으로 사전 훈련시킨 AI 모델에다 74마리의 개(치와와 42마리, 프렌치 푸들 21마리, 슈나우저 11마리)의 짖는 소리로 구성된 데이터 세트를 접목시켰다. 데이터에는 으르렁거리는 소리, 훌쩍이는 소리, 크고 작은 짖는 소리 등이 포함됐다. 그 결과 '인간+개' 소리로 훈련된 AI 모델은 62%의 정확도로 개의 감정을 식별했고, 62%의 정확도로 개의 품종을, 69%의 정확도로 성별을 알아맞췄다. 

또 여러 마리 개 중에서 특정 개를 50%의 정확도로 가려냈다. 모든 항목에서 인간의 음성을 기반으로 '개 짖는 소리'를 접목시킨 데이터가 높은 정확도를 보였다. 이는 인간의 말에서 파생된 소리와 패턴이 잠재적으로 동물을 이해하는 기초가 될 수 있음을 시사한다. 

미할체아 AI연구소 소장은 "인간의 음성에 최적화된 기술이 동물의 의사소통을 해독하는 데 도움이 되도록 구축된 것은 이번이 처음이다"라며 "우리의 결과는 인간의 말에서 파생된 소리와 패턴이 동물의 발성과 같은 다른 소리의 음향 패턴을 분석하고 이해하기 위한 기초가 될 수 있음을 보여준다"라고 밝혔다.