"딥시크 R1보다 약 3배 정확해"…오픈AI, 심층 연구용 AI 에이전트 기능 공개

2025-02-03     진광성 기자
(사진=오픈AI)

오픈AI가 챗GPT에 새로운 에이전트 기능인 '딥 리서치(Deep Research)'를 탑재했다. AI가 실시간으로 수백 개의 온라인 소스를 찾고 분석해 연구자 수준의 보고서를 만들어주는 기능이다. 

오픈AI는 3일 새로운 AI 에이전트 기능인 '딥 리서치(Deep Research)'를 챗GPT에 탑재했다고 밝혔다. 텍스트, 이미지, PDF, 스프레드시트와 같은 파일을 추가하면 사용자는 5~30분 이내에 시각 자료가 포함된 보고서를 받아볼 수 있다. 

오픈AI는 딥 리서치 기능을 통해 챗GPT가 전문가 수준으로 연구를 진행할 수 있다고 했다. 딥 리서치는 추론형 AI 모델인 'o3'를 기반으로 작동한다. AI가 인터넷에서 방대한 양의 텍스트, 이미지 및 PDF를 검색, 해석 및 분석한다. 몇 시간이나 걸리는 작업을 수십 분만에 수행할 수 있다는 게 특징이다.

(사진=오픈AI)

딥 리서치는 금융, 과학, 정책, 엔지니어링과 같은 분야의 전문가들을 위해 만들어진 기능이다. 딥 리서치는 추론 역량을 기반으로 사람들이 직장과 일상 생활에서 직면하는 다양한 유형의 문제를 해결할 수 있도록 도울 수 있다고 한다. 

프롬프트에 '딥 리서치' 메뉴를 누르고 명령을 내리면 된다. 조사가 끝나면 사용자에게 알림을 보내고, 최종 출력은 채팅 내 보고서로 도착한다. 오픈AI는 새 에이전트가 AI 성능 평가 중 하나인 '인류의 마지막 시험(Humanity’s last exam)'에서 26.6%의 정답률을 기록했다고 말했다. 

'인류의 마지막 시험'은 100개 이상의 광범위한 주제에 걸쳐 3000개 이상 객관식·단답식 답을 구하는 평가다. 가장 점수를 따기 어려운 AI 성능 평가로도 불린다. 이 평가에서 딥시크 R1이 9.4%, 그록-2가 3.8%, 클로드 3.5 소네트가 4.3%를 기록했다. 

(사진=오픈AI)

이를 감안하면 딥 리서치 모델은 꽤 높은 성적표를 거둔 셈이다. 이 기능은 유료 멤버십 구독자를 대상으로 제공할 계획이다. 이날부터 챗GPT 프로(200달러) 구독자에게 먼저 제공된다. 플러스(월 20달러), 팀(월 25달러)과 엔터프라이즈(기업용) 구독자에게 순차적으로 지원된다. 

오픈AI는 "앞으로는 더욱 전문화된 데이터 소스에 연결해 구독 기반 또는 내부 리소스에 대한 액세스를 확장할 것"이라며 "이를 통해 출력을 더욱 강력하고 개인화할 수 있다"라고 했다.