(사진=앤트로픽)
(사진=앤트로픽)

앤트로픽이 코딩 기능을 업그레이드한 '클로드 소네트 4.5' 모델을 출시했다. 프로토 타입을 넘어 실제 사용 가능한 애플리케이션 구축까지 가능하다는 것이 앤트로픽의 설명이다. 

앤트로픽은 30일(현지시간) 에이전트 구축, 코딩, 추론, 수학 기능을 업그레이드한 '클로드 소네트 4.5'를 출시했다고 발표했다. 클로드 소네트 4.5는 SW 문제 해결을 위한 AI 모델 능력을 평가하는 벤치마크인 SWE-벤치 베리파이드(SWE-Bench Verified)에서 경쟁사인 오픈AI, 구글 모델을 뛰어넘는 성능을 기록했다고 한다. 

앤트로픽은 "클로드 소네트 4.5는 세계 최고의 코딩 모델이다. 복잡한 에이전트를 구축하는 데 가장 강력한 모델이며, 컴퓨터 활용에 가장 적합한 모델이다. 또한 추론과 수학에서 상당한 향상을 보여준다"라고 발표했다. 

앤트로픽은 일부 기업 고객을 대상으로 한 초기 테스트 과정에서 클로드 소네트 4.5가 복잡한 코딩 작업을 최대 30시간 동안 수행하는 것을 확인했다고 밝혔다. 멀티모달 AI 에이전트의 능력을 측정하는 평가인 OSWorld에서도 소네트 4.5는 우수한 성능을 보였다. 

(사진=앤트로픽)
(사진=앤트로픽)

더불어 금융, 법학, 의학, STEM 분야의 전문가들은 소네트 4.5가 오퍼스 4.1을 포함한 기존 모델에 비해 지식과 추론 능력이 획기적으로 향상됐다고 평가했다. 커서 CEO인 마이클 트루엘은 "소네트 4.5는 최첨단 코딩 성능을 제공하며, 장기 작업에 상당한 성과를 보였다"라고 했다. 

앤트로픽은 클로드의 향상된 역량과 광범위한 안전 교육을 통해 모델의 행동을 크게 개선했다고 전했다. 아첨, 기만, 권력 추구, 망상적 사고를 조장하는 경향을 줄였다는 것이다. 

또 앤트로픽은 소네트 4.5 출시와 함께 클로드 에이전트 SDK도 공개했다. 앤트로픽은 에이전트 SDK가 클로드 코드를 구동하는 것과 동일한 인프라이며, 개발자가 자체 에이전트를 구축하는 데 사용할 수 있다고 밝혔다. 

(사진=앤트로픽)
(사진=앤트로픽)

앤트로픽은 맥스 구독자를 위해 '이매진 위드 클로드(Imagine with Claude)'라는 기능도 선보였다. 해당 기능은 AI 모델이 즉석에서 소프트웨어를 생성할 수 있다. 앤트로픽은 이 모델이 미리 정의된 기능이나 미리 작성된 코드 없이 사용자 요청에 실시간으로 응답할 것이라고 말했다. 

소네트 4.5는 클로드 오퍼스 4.1이 출시된 지 두 달도 채 되지 않은 시점에 공개됐다. 이처럼 AI 업계의 치열한 경쟁으로 인해 신모델 출시 주기가 짧아지고 있다. 이에 특정 기업이 오랫동안 의미 있는 선두를 유지하기 어려워지고 있다는 게 업계의 분석이다. 

AI포스트(AIPOST) 마주영 기자 aipostkorea@naver.com