구글 딥마인드의 인공지능(AI) 모델이 국제수학올림피아드(IMO)에서 금메달에 해당하는 점수를 공식으로 인정받았다.
1959년부터 열리고 있는 국제수학올림피아드는 수학계 노벨상으로 불리는 필즈상 수상자들이 참가할 정도로 권위 있는 대회다. 최근 들어 AI의 수학적 추론 능력을 평가하는 기준으로도 활용되고 있다.
고득점을 획득한 참가자들에게 메달이 수여되며, 약 8%의 참가자만이 금메달을 받는다. 구글 딥마인드는 IMO 채점자들이 '제미나이 딥 싱크(Gemini Deep Think)'의 고급 버전이 제출한 답안을 인간 참가자들과 똑같은 조건과 채점 기준으로 평가한 결과 42점 만점에 35점이 나왔다고 밝혔다.
올해 IMO에는 110개국 국가대표 630명이 참가했다. 이 가운데 67명이 금메달, 103명이 은메달, 145명이 동메달, 132명이 등외 장려상을 받았다. 금·은·동메달 커트라인은 각각 35점, 28점, 19점이었다. IMO 위원장인 그레고르 돌리나르 류블라냐대 교수는 "구글 딥마인드가 42점 만점에 35점을 획득하며 그토록 바라던 이정표에 도달했음을 확인할 수 있다"라고 밝혔다.
이어 그레고르 돌리나르 류블라냐대 교수는 "딥마인드의 솔루션은 여러 가지 면에서 놀라웠다"라며 "IMO 채점자들은 이 답안들이 명확하고 정밀하며, 답안 대부분이 전개를 따라가기 쉽다고 평가했다"라고 설명했다.
이번 성과는 지난해 구글의 '알파지오메트리 2'와 '알파프루프' 모델이 거둔 성과에 비해 상당한 진전이라고 평가된다. 두 모델은 지난해 은메달에 해당하는 28점을 받았다. 그러나 계산 시간이 2~3일 소요됐으며, 자연어로 문제를 읽고 답안을 제출한 것도 아니었다.
이와 달리 이번 대회에 참가한 제미나이 딥 싱크는 문제마다 단계별로 보조정리(lemma)와 정리(theorem) 등을 스스로 고안해내 체계적이고 일목요연하고 엄밀하게 답안을 제출했다. 또한 자연어로 답변을 제출했고, 제한 시간도 넘기지 않았다.
구글은 'AI 울트라' 구독자들에게 모델을 출시하기 전 수학자 등 신뢰할만한 테스터들에게 먼저 이 버전을 제공할 예정이다. 딥마인드 측은 "자연어 유창성과 엄밀한 추론을 결합한 에이전트가 수학자, 과학자, 엔지니어, 연구자들에게 매우 귀중한 도구가 될 것"이라며 "AGI(인공일반지능)로 나아가는 길에서 인간 지식을 발전시키는 데 도움이 될 것"이라고 밝혔다.
AI포스트(AIPOST) 진광성 기자 aipostkorea@naver.com

