한국인처럼 자연스럽게 대화하는 인공지능 개발 추진

(사진=국립국어원)
(사진=국립국어원)

[중앙뉴스=신현지 기자] 국립국어원이 한국어를 자연스럽게 대화하는 차세대 인공지능 개발을 위해 SK텔레콤과 손을 잡았다. 국립국어원은 지난 7일 SK텔레콤과 업무 협약을 체결하고, 국립국어원의 언어 정보를 활용해 한국어에 최적화된 차세대 인공지능(AI) 언어 모델을 개발하는데 적극 협력하기로 했다고 밝혔다.

이에 따라 국립국어원은 인공지능 한국어 학습 자료인 한국어 말뭉치, 한국수어 말뭉치 등 다양한 언어 정보 자원을 SK텔레콤과 공유하고, 에스케이텔레콤은 이를 활용해 사람처럼 자연스럽게 대화하는 차세대 인공지능 한국어 범용 언어 모델 개발에 착수하게 된다.

또 새로 개발되는 차세대 AI 한국어 모델은 내부 검증을 거쳐 다양한 서비스에 적용되며, 한국어 언어 모델과 데이터의 품질 평가에 관한 연구도 진행하게 된다. 아울러 국립국어원이 주최하는 ‘2021년 국어 정보처리 시스템 경진대회’를 SK텔레콤의 기존 인공지능 언어 모델을 활용해 인공지능의 언어소통 능력을 겨루는 방식으로 개편해 개최하게 된다.

국립국어원 정희원 어문연구실장은 "앞으로도 인공지능 개발에 필요한 언어 정보자원을 지속해서 발굴해 관련 산업계와 학계에서 유용하게 활용될 수 있도록 시스템을 구축해 나가겠다"고 말했다.

이와 관련한 SK텔레콤은 올해 말까지 1500억개의 매개변수를 가진 거대 언어 모델 GLM을 개발해 내부 서비스를 통해 모델 성능을 검증한 후 상용화를 진행한다는 계획이다. SK텔레콤에 따르면 GLM은 일상의 감성 대화, 다양한 업종의 고객센터 대화뿐만 아니라 시사, 문학, 역사, 게임에 이르기까지 다양한 영역의 언어 활동에 적용될 수 있다.

특히 최신 언어 모델인 GPT-3가 1750억개의 매개변수를 가지고 있어 이전 버전인 GPT-2보다 100배 이상 크고 더욱더 높은 정확도와 넓은 활용도를 가진 점을 고려하면 GLM은 한국어 AI 언어 모델의 결정판이 될 것으로 예상하고 있다.

한편, 문화체육관광부와 국립국어원은 2018년부터 인공지능 학습용 한국어 말뭉치를 구축해 '모두의 말뭉치'에 공개하고 있다. 이 말뭉치는 지난해 10월 SK텔레콤이 개발한 인공지능 언어 모델 '코바트'를 비롯해 관련 산업계와 학계에서 활용되고 있다.

SKT 데이비스 에릭 하트먼 Language Superintelligence Labs장은 "SKT는 한국어에 최적화된 인공지능 언어 모델을 선제적으로 개발해 한국어의 정보화에 이바지하고 있다"며 "이번 국립국어원과의 협력을 계기로 한국어의 과학화, 세계화에도 이바지할 계획"이라고 전했다.

저작권자 © 중앙뉴스 무단전재 및 재배포 금지