제미나이·클로드 중에 어떤 게 낫죠?…"구글, 제미나이 AI 개선에 '클로드' 활용"
테크크런치 "클로드 사용해 제미나이 개선 중"
구글이 자사의 인공지능(AI) 모델 제미나이 성능 개선을 위한 프로젝트에 전담 계약직 인력을 투입시킨 것으로 전해졌다. 이들은 제미나이와 경쟁사의 AI 모델의 답변을 비교하는 식으로 점수를 매기고 있다고 한다.
24일(현지시간) 테크크런치 등 외신보도에 따르면 구글이 제미나이 성능 개선을 위해 계약직 직원들을 투입시켜 프로젝트를 진행 중이다. 경쟁사 AI 모델과 제미나이의 답변을 비교하는 방식으로 점수를 매기고 있는데, 여기에 앤트로픽의 클로드를 활용 중인 것으로 알려졌다.
거대언어모델(LLM) 개발 기업들은 보통 자사의 AI 모델 성능 향상을 위해 경쟁사와 비교하는 작업을 진행한다. 일반적으로 각종 벤치마크 평가를 통해 성능을 평가하는 방식으로 이뤄진다. 그러나 구글은 제미나이와 경쟁사의 AI의 대응을 꼼꼼히 평가한다고 한다.
프로젝트에 참여한 계약직 직원들은 모델 출력의 정확도를 평가하며 진실성과 상세성 등 여러 기준에 따라 응답에 점수를 매긴다. 직원들은 각 프롬프트당 최대 30분 동안 제미나이와 클로드 답변 중 누구의 답변이 더 나은지 판단해야 한다.
테스트에 참여한 한 직원은 "클로드의 안전 설정은 AI 모델 가운데 가장 엄격하다"라고 밝혔다. 프롬프트마다 두 모델이 다른 답변을 내놓기도 했다고 한다. 클로드가 응답을 거부한 프롬프트에 제미나이는 '안전 위반'이라는 답변을 내놓았다.
구글이 테스트를 진행하면서 앤트로픽에 클로드 사용을 허가받았는 지는 확인되지 않았다. 앤트로픽의 상업적 서비스 약관에 따르면 고객들은 앤트로픽의 승인 없이 '경쟁 AI 모델 훈련'을 위해서 클로드를 사용할 수 없다. 구글은 앤트로픽의 주요 투자자들 중 하나다.
이에 대해 시라 맥나마라 구글 딥마인드 대변인은 "모델 출력을 비교하지만, 제미나이 모델 학습에 앤트로픽 모델들을 활용하지는 않는다"라고 했다.