"7만원으로 30분 만에 'o1', '딥시크 R1' 수준 AI 모델 개발"

美 스탠퍼드·워싱턴대, 낮은 비용으로 고성능 AI 모델 구현

2025-02-09     유진 기자
(사진=엔바토 엘리먼트)

미국 스탠퍼드대와 워싱턴대 인공지능(AI) 연구진이 50달러(약 7만 2000원)도 안 되는 클라우드 컴퓨팅 비용으로 AI 추론 모델을 훈련시켰다고 전해져 관심이 쏠리고 있다. 

미국 스탠퍼드대, 워싱턴대 AI 연구진은 50달러도 안 되는 비용으로 개발된 AI 모델 's1'을 깃허브에 공개했다. AI 모델 's1'이 수학과 코딩 능력 테스트에서 오픈AI의 'o1(오원)', 딥시크 'R1'과 유사한 성능을 보였다고 연구진은 설명했다. 

연구진은 s1을 개발하는 과정에서 '증류(distillation)'라고 부르는 기술적 과정을 통해 미세 조정했다고 밝혔다. 증류는 다른 AI 모델의 답변을 훈련 목적으로 사용해 '추론' 기능을 추출하는 과정을 일컫는다. 

s1 모델은 구글의 최신 추론 모델인 '제미나이 2.0 플래시 싱킹 익스퍼리멘털(Gemini 2.0 Flash Thinking Experimental)'에서 증류했다. 딥시크는 AI 모델을 개발하며 오픈AI의 모델을 증류한 것으로 알려졌다. 

(사진=AI포스트 DB)

s1과 같은 추론 모델이 비교적 작은 데이터셋에서도 훈련될 수 있다고 연구진은 설명했다. 연구진은 s1을 훈련하기 위해 신중하게 큐레이팅된 1000개의 질문과 답을 담은 데이터셋을 선별해 사용했다. 

연구진은 "엔비디아의 그래픽처리장치(GPU) 16개를 사용해 s1을 훈련시켰고, 30분도 걸리지 않았다"라며 "총비용은 50달러도 들지 않았다"라고 했다. 스탠포드 연구진은 s1 훈련에 필요한 컴퓨팅 성능을 약 20달러에 빌릴 수도 있다고 했다. 

한편 메타, 구글, 마이크로소프트 등 기업들은 올해 수천억 달러를 AI 인프라에 투자할 계획이다. 차세대 AI 모델을 훈련하는 데 대부분 사용될 예정이다. '증류' 방식으로 기존 AI 모델을 복제할 수 있지만, 훨씬 더 나은 AI 모델을 만들지는 못한다는 게 전문가들의 의견이다.