지난 6월 말 국내 최대 규모의 인공지능(AI), Web3 실무형 컨퍼런스인 '서울메타위크 2025'가 진행됐다. 이에 국내외 AI 전문가들이 서울을 찾았다. AI 에이전트, AI 콘텐츠, 멀티모달 AI, 생성형 AI, 웨어러블 등이 핵심 의제로 다뤄졌다.
현장을 찾은 기업인들은 '신(新) AI 비즈니스'에 대한 힌트를 얻었다는 반응을 보였다. 이재명 정부가 AI 3대 강국(G3) 도약을 목표를 내건 가운데 한국 기업들이 글로벌 경쟁력을 보유하기 위해선 시장의 흐름을 잘 읽고, 서비스로 잘 엮어내야 한다. 즉, 알아야 한다는 의미다. 서울메타위크의 주요 연사들의 발언을 AI포스트(AIPOST)가 정리해 봤다. <편집자주>
조 위(Zhuo Wu) 인텔 AI 에반젤리스트는 서울메타위크 2025에서 '멀티모달 RAG와 인지형 AI로 여는 차세대 AI'라는 주제로 강연을 진행했다. 조 위는 딥러닝부터 5G 무선 통신 기술, 컴퓨터 비전, 머신러닝, 엣지 컴퓨팅 등 다양한 분야의 기술 발전에 기여하고 있다.
특히 벨 연구소(중국)에서 연구 과학자로 근무하며 4G-LTE와 5G 무선 통신 시스템에 관한 광범위한 연구를 진행하고 다수의 특허를 출원했다. 그는 상하이 대학교에서 부교수로 재직할 당시에는 주요 연구원으로서 여러 연구 프로젝트를 성공적으로 이끌었다.
조 위는 강연 서두에서 '인지형 AI'라는 개념을 소개했다. 조 위는 "아기가 처음부터 새로운 것을 배우는 과정과 비슷하다고 생각하면 된다. '사과'라는 단어를 배울 때, 만져보고 그림책에서 보고 영상으로도 보면서 모든 감각을 활용한다"라며 "인지형 AI도 마찬가지다. 다양한 소스에서 얻은 데이터를 모두 학습해 추론하며 복잡한 작업을 수행하는 능력을 갖추는 것"이라고 했다.
그는 "길을 가다 마음에 드는 신발을 발견하면 사진을 찍어둔다. 이때 인지형 AI 비서가 있다면, 찍어둔 사진과 텍스트 검색어를 함께 분석해 정확한 상품을 찾아주고 구매도 도와줄 수 있다"라며 "과거 진단 보고서와 새로운 CT 스캔 영상을 분석해 의사가 더 정확한 진단을 내릴 수 있도록 참고자료를 제공할 수 있다"라고 설명했다.
조 위는 '인지형 AI' 기반 가상 비서가 인류의 삶을 더 편리하게 만들어 줄 수 있을 것이라고 강조했다. 조 위는 "인텔의 OpenVINO 툴킷 덕분에 이러한 AI 비서도 노트북에서 실행할 수 있게 된다"라며 "OpenVINO는 다양한 하드웨어 플랫폼에서 모델 성능을 최적화하는 도구들을 제공한다"라고 강조했다.
조 위는 CPU, GPU, MPU 등 환경에서도 AI 모델을 효율적으로 구동할 수 있도록 OpenVINO가 도울 수 있다고 했다. 아울러 "대규모언어모델의 경우에도 가중치 압축 기술을 사용하면 모델 크기를 25GB에서 3.5GB로 약 90%까지 줄일 수 있다. RAM 사용량도 크게 줄여주기 때문에 노트북에서도 AI 작업을 효율적으로 실행할 수 있게 되는 것"이라고 덧붙였다.
그는 "인지형 AI 비서를 구축하는 데 '멀티모달 RAG' 파이프라인은 매우 중요하다. 이는 텍스트, 비디오, 의료 이미지 등 다양한 데이터를 처리하고 활용하는 방식"이라며 "모든 데이터는 먼저 멀티모달 임베딩 모델을 통해 벡터로 변환돼 로컬 지식 기반에 저장된다"라고 말했다.
이어 "사용자가 질문을 하면 벡터 데이터베이스에서 질문과 관련된 데이터를 검색하고, 검색된 데이터와 질문은 '비전언어모델'로 보내져 처리된다. 이후 최종적으로 답변을 제공하는 방식이다"라면서 "AI 에이전트 워크플로우는 '모델 컨텍스트 프로토콜(MCP)'을 기반으로 한다. 여기에는 두 가지 수준의 에이전트가 있다"라고 밝혔다.
조 위는 "첫 번째는 라우팅 에이전트로, LLM을 사용해 사용자 질문의 의도를 분석하고 어떤 에이전트를 호출할지 결정한다. '쇼핑 도우미 에이전트'의 경우 RAG를 사용해 상점의 재고와 같은 로컬 지식 기반을 활용해 사용자가 원하는 상품을 검색하고 장바구니에 담아 구매까지 돕는다"라고 했다.
이를 통해 영상에서 본 디저트 레시피를 찾고 재료까지 구매하는 것도 가능하다고 조 위는 밝혔다. 조 위는 "마지막으로 컴퓨터 에이전트도 있다. 사용자의 요청에 따라 컴퓨터 작업을 직접 수행하는 에이전트다. 이 모든 과정은 대규모언어모델이 단계별로 계획하고 에이전트가 직접 실행한다"라고 강조했다.
끝으로 조 위는 "OpenVINO를 통해 모델 크기를 줄이고, 추론 속도를 높이며 메모리 사용량을 절감할 수 있다"라면서 "개발자라면 깃허브 저장소에서 모든 소스 코드를 확인하고 직접 시도해볼 수 있다"라고 말했다.
한편 TV조선과 크리스앤파트너스가 공동으로 주최하고, 토큰포스트와 인공지능 전문언론 AI포스트(AIPOST), 핀텔리가 공동 주관하는 서울메타위크 2025는 지난 6월 26일부터 27일까지 양일간 서울 코엑스 3층 오디토리움(Auditorium)에서 열렸다.
AI포스트(AIPOST) 유진 기자 aipostkorea@naver.com

