구글 딥마인드 연구진이 게임 마인크래프트에서 다이아몬드를 채굴할 수 있는 인공지능(AI) 모델 '드리머(Dreamer)'를 개발했다. 사람의 도움 없이 스스로 시행착오를 거듭하며 목표를 달성한 셈이다.
마인크래프트는 다양한 지형으로 이뤄진 3D 가상세계를 탐험하며, 블록을 부수며 자원을 수집해 건축묵을 제작하는 게임이다. 철, 금, 다이아몬드 광물을 수집해야 캐릭터 보호하는 장비를 만들 수 있다. 이 가운데 다이아몬드는 최고의 광물로 평가받는다.
다이아몬드를 얻기 위해선 나무, 돌 등의 재료로 도구를 만들어야 하고, 그 도구로 더 튼튼한 곡괭이 등을 제작해야 한다. 플레이 경험이 있는 숙련된 이용자들은 단시간 내 다이아몬드를 찾지만, 초보 이용자들은 다이아몬드를 얻는 데 몇 시간이 걸리기도 한다.
구글 딥마인드의 다니야르 하프너 연구원팀이 개발한 AI 모델 '드리머'는 마인크래프트 내에서 다이아몬드를 스스로 찾는 데 성공했다고 한다. 하프너는 "드리머는 일반 AI 시스템을 향한 중요한 발걸음을 나타낸다. AI가 물리적 환경을 이해하고 시간이 지남에 따라 스스로 개선할 수 있게 해준다"라고 했다.
AI가 게임 내 목표를 수월하게 달성하기 위해서는 짜여진 대로만 움직이면 안 된다. 기존 AI 모델들은 인간의 플레이 영상을 학습해 게임 실력을 키워왔다. 반면 딥마인드의 모델은 주변 환경을 인지하고, 미래 시나리오를 상상해 의사결정을 내리도록 설계했다.
이에 AI 모델 '드리머'는 마인크래프트에서 적은 계산을 사용해 다양한 작업을 시도하고 잠재적인 보상을 예측했다. 이에 따라 연구진은 보상을 주는 방식으로 훈련을 진행했다. 그 결과 스스로 시행착오를 겪으며 최선의 방향을 찾아 목표에 도달할 수 있게 됐다.
연구진은 30분마다 게임을 초기화했다. AI가 주변 환경에 익숙해지지 않도록 하기 위함이다. AI가 최초의 다이아몬드를 채굴하려면 약 9일 동안 게임을 플레이해야 한다고 연구진은 밝혔다.
연구진은 이러한 AI의 능력이 로봇에도 적용될 수 있다고 했다. 현실 세계와 상호작용을 하는 과정에서 로봇이 작업을 배우기 위한 최적의 동작들을 스스로 배울 수 있다는 의미다. 다만 하나의 작업을 배우는 데 상당히 오랜 시간이 걸릴 것으로 보인다.
AI포스트(AIPOST) 유진 기자 aipostkorea@naver.com

