(사진=엔비디아)
(사진=엔비디아)

엔비디아가 대규모 컨텍스트 처리를 위해 설계된 새로운 GPU인 '루빈 CPX(Rubin CPX)'를 발표했다.

엔비디아는 9일(현지시간) 소프트웨어 개발과 동영상 생성 등 작업에 특화된 GPU '루빈 CPX'를 공개했다. 루빈 CPX는 엔비디아의 차세대 루빈 시리즈 중 하나로, AI 모델이 장문 데이터를 효율적으로 처리할 수 있도록 지원한다. 

또한 루빈 CPX는 AI 코딩 어시스턴트가 단순한 코드 생성 도구를 넘어 대규모 소프트웨어 프로젝트를 이해하고 최적화할 수 있는 정교한 시스템으로 탈바꿈할 수 있도록 돕는다. 

AI 모델은 비디오 처리를 위해 한 시간 분량의 콘텐츠에 대해 최대 100만 개의 토큰을 사용할 수 있으며, 이는 기존 GPU 컴퓨팅의 한계를 뛰어넘는 수준이다. 루빈 CPX는 비디오 디코더와 인코더, 긴 컨텍스트 추론 처리를 단일 칩에 통합해 전례 없는 성능을 제공한다.

엔비디아의 창립자 겸 CEO인 젠슨 황은 "베라 루빈 플랫폼은 차세대 루빈 GPU와 CPX라는 새로운 프로세서를 모두 선보이며 AI 컴퓨팅의 지평을 열 또 다른 도약을 이룰 것"이라며 "루빈 CPX는 모델이 수백만 개의 지식 토큰을 동시에 추론하는 대규모 컨텍스트 AI를 위해 특별히 설계된 최초의 CUDA GPU이다"라고 설명했다. 

(사진=엔비디아)
(사진=엔비디아)

AI 코딩 도구를 제공하는 커서(Cursor)도 루빈 CPX가 개발자 생산성을 높이는 데 도움이 된다는 것을 인지하고 있다고 한다. 커서 CEO 마이클 트루엘은 "엔비디아 루빈 CPX를 통해 커서는 초고속 코드 생성과 개발자 인사이트를 제공해 소프트웨어 개발에 혁신을 가져올 것"이라고 말했다. 

생성형 AI 기업 런웨이도 엔비디아 제품으로 정교한 영상을 제작할 수 있는 AI 모델을 구축할 계획이다. 런웨이의 CEO인 크리스토발 발렌수엘라는 "루빈 CPX는 더욱 일반적이고 지능적인 크리에이티브 도구를 구축할 수 있도록 하는 획기적인 성능 향상을 가져올 것으로 예상한다"라고 강조했다. 

엔비디아 루빈 CPX는 가속화된 인프라부터 엔터프라이즈급 소프트웨어까지 전체 엔비디아 AI 스택을 지원하게 된다. AI 추론을 효율적으로 확장하여 처리량을 획기적으로 높이는 동시에 응답 시간과 모델 제공 비용을 절감할 수 있다는 설명이다.

한편, 루빈 CPX는 2026년 말 출시될 예정이며, 엔비디아는 이를 통해 AI 인프라 시장에서의 지배력을 더욱 강화할 계획이다.

AI포스트(AIPOST) 유진 기자 aipostkorea@naver.com