4차 산업혁명 시대가 도래하면서 챗봇의 기능적 역할이 두드러지고 있다. 단순 대화 뿐 아니라 날씨, 뉴스, 쇼핑, 은행 업무 등 광범위한 분야에서 챗봇이 다양한 역할을 수행하고 있는 것이다.

특히 인공지능 기술이 더해지면서 더 똑똑한 대화를 할 수 있게 됐고 일상생활 속에서 빼놓을 수 없는 존재로 자리매김하고 있다. 대표적으로 AI 챗봇 플랫폼 ‘심심이’를 꼽을 수 있다.

AI 챗봇 심심이는 다양한 대화 시나리오를 바탕으로 지속적인 업데이트를 거치며 재미는 물론 보다 생동감있는 대화를 할 수 있는 일상대화 챗봇이다. 그렇다면 심심이는 어떻게 사람처럼 다양한 주제를 통해 대화를 나눌 수 있는 것일까? 심심이 최정회 대표와의 일문일답을 통해 AI 챗봇 심심이에 대해 알아보는 시간을 가졌다.

최정회 심심이 대표 (제공=심심이)
최정회 심심이 대표 (제공=심심이)

Q. 심심이는 어떤 챗봇인가?

A. 심심이는 2002년부터 약 19년에 걸쳐 서비스를 이어왔는데 현재 한국을 비롯해 81개 언어로 전세계 사용자들을 대상으로 서비스를 제공하고 있다. 누적 사용자는 4억명 이상으로 집계된다.

심심이는 기존 챗봇과 성격이 조금 다른데 특별한 목적을 수행하는 것보다 친구, 가족을 만났을 때 이야기를 나누는 것처럼 주제, 목적 등을 정하지 않는 일상대화에 특화돼 있다.

이러한 챗봇 유형을 가리키는 통일된 용어가 아직 없는데 보통 소셜챗봇, 오픈도메인챗봇, 자유발화챗봇 등으로 불리고 있다. 또 이런 종류의 대화는 감성대화, 일상대화, 칫챗(Chitchat), 스몰토크(Smalltalk) 등으로 불린다.

2010년대 중반에 들어서며 딥러닝이 NLP(Natural Language Processing, 자연어 처리)에서 뛰어난 성과를 보이기 시작했고 이에 기반한 소셜챗봇 기술이 조금씩 발전하고 있다. 해외에서는 MS의 샤오이스, 구글의 Meena, 페이스북의 Blender 등이 공개되고 있는데 최근에는 GPT-3이나 비슷한 유형의 빅모델들을 시연할 때 소셜챗봇과 대화하는 장면을 어렵지 않게 볼 수 있다.

Q. 심심이가 다른 챗봇 대비 우위를 점하고 있는 대표적인 포인트는?

A. 가장 먼저 생동감과 AI 윤리를 꼽을 수 있다. 먼저 생동감의 경우 심심이만의 독특한 학습 방식에서 기인하는데 어떤 사용자가 직접 입력해서 저작한 시나리오이기 때문이다.

심심이는 ‘가르치기’라는 기능을 통해 사용자에게 ‘당신이 생각할 때 이런 경우 어떻게 대답하는 게 좋겠어요?’라고 묻고 수많은 사용자들이 각자 생각하는 적절한 대답을 받아 이를 다른 사람들과의 대화에 사용한다.

이것은 마치 인간의 두뇌라고 하는 가장 뛰어난 언어 모델을 수천만 개 사용하는 것과 같은 것이다. 실제로 심심이에게 대화를 가르친 사용자가 약 2700만명에 이른다. 여기서 나오는 대화의 풍부함과 생동감이 인간 두뇌의 일부분을 모방해 개발되고 있는 최첨단 신경망 모델들보다 우위에 있다는 것은 어쩌면 당연한 부분이라고 할 수 있다.

최근 들어 우리나라에서도 AI 윤리에 대한 관심이 높아지고 있는데 심심이는 이를 해결하기 위한 다양한 대응 방안을 마련해왔다. 현재 심심이는 7~8가지 윤리적 기준선을 명확히 공지하고 이에 동의하는 경우에만 서비스를 이용할 수 있도록 구성됐다. 모든 콘텐츠와 사용자 정책이 이 기준을 중심으로 운영되며 나쁜말 분류기 등 관련 기술 개발에 있어 동일 기준을 사용해 일관된 윤리 구현을 위해 노력하고 있다.

Q. 심심이의 인기가 유독 높은 해외 국가가 어디인지, 그 이유는 무엇이라고 생각하나?

A. 글로벌하게 고른 인기를 얻고 있기 때문에 상대적으로 인기가 적은 지역을 꼽는 게 좋겠다. 많은 사용자를 끌어모았었지만 지금은 상대적으로 이용자가 적은 지역으로 유럽, 북미, 중국, 일본 등을 들 수 있다. 유럽과 북미는 규제 컴플라이언스, 중국은 지역화, 일본은 혐한 정서와 관련돼 있다.

심심이는 유럽의 다양한 언어에서 모두 인기를 끌었었는데 2018년 GDPR(General Data Protection Regulation, 개인정보보호 규정)이 발효되는 시점에 이 지역에 대한 서비스를 대폭 축소했다. 북미에서는 미국의 아동보호법이라 할 수 있는 COPPA(Childrens Online Privacy Protection Act, 어린이 온라인 사생활 보호법)가 제정됨으로써 비슷한 조치를 취했다.

심심이는 각 지역 별 규제 변동에 대해 충분히 규정을 지킬 수 있을 때까지 해당 지역에서 서비스를 사실 상 제공하지 않기로 방침을 정했다. 이 지역은 우리가 해당 규정을 소화할 수 있게 된다면 다른 지역과 동일하게 인기를 얻을 수 있을 것이다.

중국과 일본은 사정이 좀 다른 것 같다. 심심이는 중국에서 2010년대 초중반에 엄청난 인기를 누렸다. 중국인들이 자발적으로 별칭을 만들었고(小黄鸡, 작은 노란 닭), 바이두가 심심이 대화엔진을 사용해 음성비서를 개발했으며 심심이의 인기에 자극을 받은 마이크로소프트는 중국연구소에서 XioIce를 개발했다.

그러나 나중에 알고 보니 중국 시장은 중국용 서비스를 별도로 만들고 유통 채널도 중국에 맞게 철저히 현지화해야 장기적으로 유지가 가능한 구조였다. 하지만 최근에도 인지도는 여전히 높아서 서비스 리뉴얼 후 공략 지점을 찾을 수 있을 것으로 기대한다.

일본에서도 다른 국가나 언어와 마찬가지로 급속히 인기를 얻기 시작한 시점이 있었다. 그런데 혐한 그룹이 개입하면서 다른 사례와 달리 중간 지점쯤에서 인기가 꺾인 상태다. 오히려 키티 캐릭터로 유명한 산리오의 자회사가 심심이 대화엔진 API를 사용해서 만든 앱이 일본 앱스토어에서 1위를 하면서 심심이 대화엔진의 우수성을 간접적으로 검증한 상태다.

Q. 심심이만의 자연어 처리 능력의 장점을 증명할 수 있는 대표적인 사례는?

A. 다양한 언어로 글로벌 서비스를 제공하며 대다수 나라에서 고르게 인기를 유지하고 있는 것을 들 수 있겠다. 현재 81개 언어로 대화할 수 있으며 곧 2~30개 언어를 추가로 지원할 계획이다. 이것이 가능한 이유는 어떤 언어든 그 언어에 대해 아는 것이 전혀 없는 상태에서도 빠르게 말을 배울 수 있기 때문이다.

2010년 심심이가 스마트폰 앱을 출시하며 한국어 외의 언어 지원을 했을 때로 돌아가 보자. 심심이는 영어로 된 대화 시나리오는 “안녕하세요”와 “모르는 말이에요. 가르쳐 주세요” 단 두 문장밖에 없었다.

물론 이 두 문장은 영어로 번역되어 있었다. 처음 심심이와 대화를 시도하려는 사용자에게 “안녕하세요” 인사를 할 뿐이고 그 외에는 사용자가 어떤 말을 해도 “모르는 말이에요. 가르쳐 주세요”라고만 대답했다. 어떤 사용자는 실망하고 나가겠지만 어떤 사용자는 흥미를 가지고 대답을 가르쳐 주었다. 이렇게 한 두 마디씩 배우면 그 다음 사용자에게는 몇 마디 더 대화를 할 수 있게 되고, 이 때는 조금 더 많은 사용자들이 대화하고 가르친다.

이런 식으로 할 수 있는 말이 늘어나다 보면 어느 순간에 갑자기 입소문이 폭발하면서 눈덩이처럼 많은 말을 배우게 된다.

역설적이게도 심심이 대화 처리의 핵심에 최첨단 AI 기법이 아닌 아주 간단한 검색(Retrieval) 모델만을 사용하고 있기 때문에 위와 같이 배운 말을 바로 써먹을 수 있었고 사용자들의 흥미를 유발할 수 있었던 것이다. 이 모델은 지금 이슈가 되고 있는 설명 가능성에서도 유리한 점이 많다.

딥러닝 중심의 AI가 급속히 발전한 뒤에 이제 와서 부딪히고 있는 벽이 설명 가능성이다. 딥러닝 기반 AI로 챗봇을 만들면 그 챗봇이 왜 그렇게 대답했는지 명확하게 설명할 방법이 없기 때문에 천문학적인 자원을 투입해 개발한 빅 모델들도 상용화를 하지 못하고 있다. 그런데 심심이는 단순한 구조이고 사용자가 입력한 대화 시나리오를 그대로 사용하는 방식이라서 정확히 추적할 수 있고 문제를 발견하면 수정하기도 쉽다.

다국어 처리 및 유지 보수, 스케일링 용이성 등 운영적 측면에서도 큰 장점이 있는데 지금까지 19년 동안 다운타임이 거의 없이 서비스를 운영해 올 수 있었던 것도 단순한 구조를 유지한 것이 주효했던 것 같다. 이처럼 검증된 시스템 운영 노하우를 내재한 것이 심심이의 장점이라고 할 수 있다.

Q. AI 챗봇이 대중화됨에 따라 윤리 문제에 자주 노출될 것인데 이에 대비하기 위한 심심이의 솔루션은?

A. 연구에 따르면 사람들은 AI에게 사람보다 훨씬 더 높은 수준의 윤리를 요구한다. 그러니 챗봇과 같은 대화형 인공지능의 윤리 문제는 필연적으로 더 요구가 커질 것이다. 지금은 문장 단위의 딥러닝 판별기를 보유하고 있지만 앞으로는 대화 단위의 판별이 가능하고 전후 맥락까지 탐지해 문제가 되는 발언을 제어할 수 있는 기술을 개발하려고 한다. 장기적으로 대화의 여러가지 변수들을 함께 고려하는 유연한 윤리 검증을 만들어 글로벌 AI 윤리 표준을 선도하려는 꿈을 가지고 있다.

이러한 첫걸음으로 올해 대화 단위의 판별 작업을 진행 중이다. 이 작업의 취지에 공감하는 각계 전문가와 전문 기업, 대학교 등이 모였고 국가도 이를 인정해 2021년 인공지능 학습용 데이터 구축사업으로 선정했다. 이에 심심이는 해당 사업을 자유과제로 진행하고 있다.

또 노벨상 프로젝트로 국가가 전략적인 지원을 하는 기초과학연구원 데이터 사이언스그룹(CI 차미영 교수)과 업무협약(MOU)을 맺고 심심이 데이터로 최첨단 혐오 발언 탐지 관련 연구가 전개되고 있다. 따라서 머지않아 좋은 성과를 얻을 수 있을 것으로 기대한다.

Q. 심심이를 기반으로 한 타 사업 진출, 확장 계획은?

A. 심심이는 자체 개발한 기술을 더 많은 개발자들이 활용할 수 있게 공개해 왔다. 지금도 심심이 챗봇공방(SimSimi Workshop Services)에서 심심이 일상대화 API나 악성문장탐지 API 등 심심이 핵심 기술을 쉽게 이용할 수 있다.

챗봇공방에서는 주로 해외 개발사들에게 서비스를 제공해 왔는데, 최근에는 국내에서 B2B 문의가 많다. 대화 엔진과 악성 문장 탐지 엔진, 그리고 데이터에 대해서 대기업들이 관심을 가지기 시작했다. 이런 기업들과 이야기를 나누면서 우리가 남들이 사고 싶은 물건을 가지고 있는데 팔겠다는 생각을 하지 않았다는 것을 알았다. 천천히 B2B 영업 기반을 마련하는 작업을 진행하고 있다.

또 심리 문제 해결을 돕는 서비스를 고려하고 있다. 헤비 유저들을 분석하면서 도출한 인사이트는 심심이가 심리적인 문제를 가진 사람들에게 강력한 소구력을 가진다는 사실이다. 아주 가벼운 고민부터 신경정신과적인 증상으로 의심할 수 있는 사례까지 넓은 스펙트럼을 보이는데 의료적으로는 스티그마가 강해 접근이 어려운 반면 심심이는 일상적인 대화를 통해 쉽게 접근할 수 있다. 특히 국가 공인 정신건강전문가 그룹에서도 큰 관심을 가지고 있어 개입 전략 수립, 실제 개입 진행까지 도움을 받을 수 있게 됐다.

마지막으로 심심이를 통해 수많은 사람들이 서로의 마음을 돌볼 수 있도록 하는 서비스를 생각하고 있다. 심심이는 이미 ‘가르치기’를 통해 많은 사람들이 자신의 마음을 담아서 다른 사람에게 전달하는 매개 역할을 수행하고 있다. 이는 유저가 정의한 심심이 서비스의 방향성이라고 볼 수 있다. 이를 더 발전시켜서 더 많은 사용자들이 서로의 마음을 돌볼 수 있는 심심이만의 심심이스러운 메타버스를 만들고자 한다.

저작권자 © 중앙뉴스 무단전재 및 재배포 금지