엔비디아, AI 에이전트 '유레카(Eureka)' 선보여
시행착오 기반 보상 알고리즘 사용해 로봇 훈련
가상환경서 펜 돌리기·가위질 등 30가지 작업 해내

(사진=엔비디아)
(사진=엔비디아)

학창시절 한 번쯤은 해봤을 '펜 돌리기'를 로봇도 할 수 있을까. 마음처럼 쉽지 않아 손가락에서 펜을 몇 번이나 떨어뜨렸던 경험이 있다면 펜을 자유자재로 돌리는 로봇의 현란한 손놀림에 놀랄지도 모른다. 최근 엔비디아(NVIDIA)가 인공지능(AI)의 도움으로 가상환경에서 로봇 손이 사람처럼 펜을 돌리는 모습을 공개해 눈길을 끌었다.

IT 전문매체 엔가젯(Engadget) 등 외신에 따르면 엔비디아 리서치는 오픈AI의 대규모 언어 모델 GPT-4로 구동되는 AI 에이전트 '유레카(Eureka)'를 개발했다고 밝혔다. 유레카는 시행착오 기반의 보상 알고리즘을 자율적으로 생성·사용해 로봇을 훈련시킨다. 이를 통해 복잡한 작업을 수행할 수 있을 만큼 로봇의 성능을 높일 수 있다는 것.

덕분에 로봇은 펜 돌리기뿐만 아니라 보다 다양하고 복잡한 기술을 익혀 수행할 수 있다고 한다. 유레카는 가상 시뮬레이션 환경에서 로봇들에게 서랍을 열거나 가위를 사용하고 공을 던져 받는 등 약 30가지에 달하는 작업을 가르쳤다.

그 결과 유레카가 생성한 학습 프로그램은 80% 이상의 작업에서 인간 전문가가 만든 프로그램보다 더 효과적이었다는 게 엔비디아 측의 설명이다. 이로 인해 로봇의 성능도 50% 이상 향상됐다. 엔비디아 연구진은 유레카가 어려운 작업을 해결하기 위해 생성 및 강화 학습법을 통합하는 새로운 알고리즘 개발을 향한 첫 걸음이라고 평가했다.

이처럼 로봇을 가르치고 훈련시키는 데 AI를 사용하는 사례가 늘어나고 있다. AI가 선생님 역할을 맡는 셈이다. 매사추세츠 공과대학(MIT)와 브리스틀 대학 등의 연구진도 AI를 사용해 로봇에게 물건을 조작하는 방법을 학습시키는 연구에 박차를 가하고 있다.

AI포스트(AIPOST) 윤영주 기자 aipostkorea@naver.com