양손으로 신발끈 묶고, 로봇 수리도…구글 딥마인드, 새로운 로봇 훈련법 공개
구글 딥마인드가 로봇의 정교한 움직임을 구현하기 위한 새로운 인공지능(AI) 훈련법을 공개했다. 더욱 쉽고 빠르게 로봇을 훈련할 수 있어, 로봇의 가정 도입이 한층 더 빨라질 것이라는 전망이다.
구글 딥마인드는 12일(현지시간) 자사 블로그를 통해 새로운 AI 학습 시스템인 '알로하 언리시(ALOHA Unleashed)'와 '데모스타트(DemoStart)'에 대한 연구 결과를 발표했다.
새로운 학습 시스템은 섬세한 움직임이 필요한 작업을 훈련하는 데 특화돼 있다. 손재주가 필요한 작업들의 경우 로봇이 학습하는 게 매우 어렵다고 한다. 그러나 로봇이 가정에 도입되기 위해서는 역동적인 환경에서 복잡한 작업을 수행하는 데 익숙해져야 한다.
구글 딥마인드의 새로운 학습법 '알로하 언리시'는 로봇이 양손으로 작업을 수행하는 방법을 배우는 데 도움을 준다. 구글 딥마인드는 새로운 방법을 통해 기존 로봇들이 신발끈을 매고, 셔츠를 옷걸이에 걸고, 다른 로봇을 수리하고, 주방을 청소하는 법을 배웠다고 밝혔다.
알로하 언리시 훈련법은 스탠포드대학교가 오픈소스로 공개한 양손 원격 조작을 위한 시스템인 '알로하2' 플랫폼을 기반으로 구축됐다. 연구진은 로봇의 행동을 원격으로 조작해 데모 데이터를 수집했다. 이어 구글의 최신 이미지 모델인 '이매진' 모델이 이미지를 생성하는 방식과 유사하게, 데이터에서 노이즈를 제거하는 방식으로 설계했다.
이를 통해 로봇이 데이터를 학습해 동일한 작업을 스스로 수행할 수 있도록 구현했다. 로봇이 다음 작업을 이미지 형태로 예측해 수행하는 셈이다. '데모스타트' 학습법은 강화 학습 알고리즘을 사용해 시뮬레이션으로 동작을 학습하는 방법이다.
먼저 쉬운 동작을 학습하고, 시간이 지남에 따라 더 어려운 동작을 수행할 수 있도록 돕는 학습법이다. 기존 학습법에 필요했던 데이터보다 훨씬 더 적은 데이터로도 학습이 가능해졌다. 그 결과 로봇은 시뮬레이션에서 특정 색상이 보이는 큐브를 맞추고, 너트와 볼트를 조이고, 도구를 정리하는 등 다양한 작업에서 98% 이상의 성공률을 달성했다.
실제 환경에서는 큐브 재배치 및 들어올리기에서 97%의 성공률을 달성했고, 정교함이 필요한 플러그-소켓 삽입 작업에서 64%의 성공률을 달성했다. 해당 학습 플랫폼을 활용하면 더 저렴한 비용한 적은 시간으로 로봇을 학습시킬 수 있다.
연구진은 "로봇이 사람처럼 물건을 잡고 다루기까지는 아직 갈 길이 멀지만, 우리는 상당한 진전을 이루고 있다"라며 "획기적인 혁신 하나하나는 올바른 방향으로 나아가는 또 다른 걸음이다"라고 밝혔다.