앤트로픽이 오픈AI의 'GPT-5' 출시에 앞서 새로운 모델인 '클로드 오퍼스 4.1(Opus 4.1)'을 출시했다.
앤트로픽은 6일(현지시간) 에이전트 작업, 코딩, 추론 기능을 업그레이드한 클로드 오퍼스 4.1을 출시했다고 밝혔다. 오퍼스 4.1은 SW 문제 해결을 위한 AI 모델 능력을 평가하는 벤치마크인 SWE-벤치 베리파이드(SWE-Bench Verified)에서 74.5%의 점수를 기록했다.
소네트 3.7(62.3%), 오퍼스 4(72.5%) 등 이전 모델을 뛰어넘는 성과를 보였다. 또한 앤트로픽은 클로드의 심층적인 연구 및 데이터 분석 능력, 특히 세부 정보 추적 및 에이전트 검색 능력이 향상됐다고 설명했다.
클로드 오퍼스 4.1은 오퍼스 4에 비해 대부분의 기능이 향상됐으며, 다중 파일 코드 리팩토링에서 눈에 띄는 성능 향상을 보였다. 라쿠텐 그룹은 오퍼스 4.1이 대규모 코드베이스 내에서 불필요한 조정이나 버그 발생 없이 정확한 수정 사항을 찾아내는 데 탁월하다고 평가했다.
윈드서프는 오퍼스 4.1이 주니어 개발자 벤치마크에서 이전 모델보다 향상된 성능을 보였으며, 이는 소네트 3.7에서 소네트 4로의 성능 향상과 거의 동일한 수준이라고 평가했다.
이번 모델은 오픈AI의 GPT-5 출시를 앞둔 시점에 공개돼 더욱 주목을 받고 있다. 한편 폐쇄형 전략을 견지해 온 오픈AI가 5일 첫 개방형 인공지능(AI) 추론 모델인 'gpt-oss' 시리즈를 선보여 화제다.
최첨단 개방형 모델 'gpt-oss-20b'과 'gpt-oss-120b' 2종을 공개했다. 이번에 공개된 오픈웨이트 모델은 사용자가 모델의 가중치를 직접 내려받아 맞춤형으로 조정할 수 있다는 게 특징이다.
두 모델 모두 로컬 환경에서도 구동이 가능하다. 두 모델 모두 텍스트 기반 언어 모델로, 개발자들은 모델이 추론에 얼마나 많은 연산 자원을 투입할지 조절해 사용 가능하다. 그러나 이미지나 음성, 영상 등 멀티모달 기능은 지원하지 않는다.
AI포스트(AIPOST) 진광성 기자 aipostkorea@naver.com

