로봇 통역사, 평창올림픽서 언어장벽 허물까

올림픽서 활약할 한컴 '지니톡'의 핵심 기술은?

컴퓨팅입력 :2017/03/21 17:20    수정: 2017/03/30 15:53

'IT 강국' 한국이 사상 처음으로 올림픽에서 언어장벽을 허물어버릴 수 있을까?

1년 앞으로 다가온 평창동계올림픽의 테마는 'ICT 올림픽'이다. 조직위원회는 이런 기조에 따라 인공지능(AI), 가상현실(VR), 5세대(G) 통신기술을 선보일 계획이다.

이 중 특히 눈길을 끄는 것이 평창올림픽 경기장 곳곳에서 활약할 '통역로봇'이다. 크게 진보한 기계번역 기술을 익힌 통역 로봇이 언어장벽을 무너뜨릴 수 있을 지 실험해 보는 좋은 무대가 될 것으로 보이기 때문이다.

이런 막중한 임무를 국내 종합 소프트웨어(SW) 기업인 한컴그룹이 맡았다. 한컴 그룹은 자사 통역번역 서비스인 ‘한컴말랑말랑 지니톡’으로 평창올림픽 기간 동안 세계 각지에서 모인 선수, 관람객, 미디어, VIP 등이 원활하게 소통할 수 있도록 ‘입과 귀’ 역할을 하게 된다. 로봇 개발사들과 협력해 지니톡을 탑재한 로봇 통역사도 배치할 계획이다.

대부분 소비자들이 오피스 소프트웨어(SW) 기업으로 알고 있는 한컴이, 평창올림픽에서 무사히 로봇 통역사를 운영할 수 있을까? 한컴은 “회사가 오랫동안 문서와 언어 분야를 연구해온 만큼 통번역 역시 잘 할수 있는 역량이 충분하다”고 자신한다.

오는 29일 지디넷코리아와 국회 4차산업혁명포럼 공동 주최로 서울 삼성동 코엑스 인터콘티넨탈호텔에서 열리는 '독일 인더스트리 4.0을 통해본 한국형 4차산업혁명 미래 모델'컨퍼런스에서 한컴은 그 자신감의 근거를 밝힌 다는 계획이다. 국내 대표 SW기업인 한컴이 4차산업혁명에 대비해 어떻게 사업을 변모시키고 있는지는 다른 기업들에게도 좋은 ‘케이스 스터디’가 될 것으로 기대된다.

(사진=한컴)한컴 말랑말랑 지니톡이 탑재된 로봇퓨로가 국회에 전시된 모습

한컴 지니톡에는 어떤 AI기술 숨어 있나

한컴은 지난 2015년 사내벤처로 시작한 자회사 한컴인터프리를 통해 한국전자통신연구원(ETRI)이 개발한 통번역 서비스 지니톡 기술을 이전 받았다. 베타기간을 거쳐 지난해 7월 ‘한컴 말랑말랑 지니톡’이란 서비스로 공식 출시했다. 한국어, 영어, 중국어, 일어, 스페인, 프랑스어, 러시아어, 독일어 등 8개 언어에 대한 원천기술을 중심으로 총 29개 언어의 번역 서비스를 지원한다.

통번역 서비스는 구글, 마이크로소프트(MS), 네이버 등 내로라하는 국내외 IT기업들이 치열하게 경쟁하고 있는 분야다. 한컴 측은 "급성장하고 있는 통번역서비스 시장에서 구글, 네이버와 함께 경쟁할 것”이라며 서비스에 자신감을 드러내고 있다.

지니톡의 통번역 품질은 어느정도 일까? 쓸만한 통변역을 제공하려면 사람이 어떤말을 하는지 알아듣는 음성인식과 입력된 언어를 다른 언어로 바꿔주는 번역, 두 가지 영역에서 모두 품질을 보장해야 한다.

한컴 말랑말랑 지니톡 서비스에 인공신경망 기술이 적용됐다

한컴인터프리 지니톡 개발팀 김무중 팀장에 따르면 먼저 번역 부분에선 개발 초기부터 강점이 있던 규칙기반기계번역(RBMT) 기술에 구글 번역과 네이버 파파고에도 적용된 인공신경망(NMT) 기술을 하이브리드로 결합했다.

RBMT는 언어학 전문가들이 문법과 많이 쓰는 숙어 등을 규칙으로 만들어 학습시키는 방식이다. 2015년 ETRI가 지니톡을 처음 선보였을 때 구글 번역보다 더 자연스러운 번역을 제공할 수 있었던 기반이기도 하다. 당시 “배고파 죽겠어”라는 말을 영어로 번역하면 구글은 “헝그리 다이(Hungry die)”라고 바꿨지만, 지니톡은 “아임 스터빙(I’m starving)” 이라고 제대로 번역했다.

NMT는 많이 알려진 것처럼 구문이 아니라 문장 전체를 하나의 단위로 번역하는 기술이다. 문맥과 어순까지 고려하기 때문에 보다 자연스럽다. 이전까진, RBMT 기술 덕분에 지니톡의 한국어 번역 품질이 좋았지만 지난해 11월 이후 막대한 데이터를 가지고 있는 구글과 네이버가 NMT를 적용하면서 품질이 획기적으로 향상됐다. 지니톡도 올해 2월 NMT를 적용해 수준을 다시 한단계 업그레이드 한 것이다.

지니톡은 보다 적합한 번역을 제공하기 위해 이 두가지 방식을 동시에 쓰는 게 큰 특징이다. 김무중 팀장은 “RBMT와 NMT에 동시에 번역을 시키고 문장의 완성도를 판단해 더 완성도 높은 결과를 최종적으로 소비자들에게 내보내 지니톡의 정확도가 상당히 높다”고 강조했다.

그렇다면 RBMT와 NMT를 방식을 결합해 지니톡은 얼마나 더 정확해졌을까? 김무중 팀장은 “CNN 영어 뉴스를 그대로 번역했을 때 사람이 그 내용을 80%이상 이해할 수준이 됐다”고 설명했다.

통번역서비스에서 번역 기술 못지 않게 중요한 부분이 음성인식이다. 기계가 제대로 알아듣지 못하면 번역 자체가 불가능 하기 때문이다. 김무중 팀장은 “음성인식은 어느 업체나 96% 수준으로 상향 평준화됐다”면서도 “평창올림픽에선 사람마다 다른 억양과 발음을 기계가 포착해 내는 기술이 관건”이라고 강조했다.

평창올림픽에선 외국어를 사람마다 다르게 발음하는 문제를 극복하는게 가장 큰 도전과제다. 김 팀장은 “외국인 중 어떤 사람은 ‘평창’을 ‘푱창’ 이라고 얘기할 수 있고 '봅슬레이'는 '밥슬레이'라고 발음할 수 있다”며 “모국어와 외국어를 섞어서 발화할 때 고유명사를 얼마나 잘 인식하느냐가 매우 중요한 문제가 될 것이다”고 설명했다.

‘한컴 지니톡은 이 문제를 풀기 위해 다양한 외국인들을 모집해 평창올림픽에서 많이 쓰일 수 있는 단어에 대해 발음 패턴을 다 만들고 있다”고 그는 덧붙였다.

4차산업혁명 시대…국내 대표SW 한컴은 변신중

많은 사람들의 머리속에 한컴은 오피스SW 기업이라는 생각이 크다. 이 때문에 평창올림픽에서 선보일 통역 로봇에도 기대반 걱정반의 시선을 보내는 사람이 많은 것도 사실이다.

이런 시선에 대해 김무중 팀장은 오피스SW와 통번역 서비스는 밀접한 관련이 있다고 강조한다. 그는 “오피스는 언어 플랫폼의 기반이기 때문에 한컴은 상당히 많은 문서 데이터와 패턴을 보유하고 있다”며 “언어처리라는 범주 안에서 관련성이 있는 통번역 분야로 사업이 확대된 것이라고 봐야 한다”고 설명했다.

좀 더 큰 그림에서 보면 한컴 그룹은 지난 2~3년간 차근차근 변화를 준비해왔다. 꾸준한 인수합병을 통해 임베디드SW 기업 MDS, 보안업체 한컴시큐어, 디지털 수사기법인 포렌식 전문업체 한컴지엠디 등 종합SW 그룹으로 몸집을 키웠다. 또 통번역 지니톡, 전자책 독립출판 플랫폼 위퍼블, 디지털 노트 핸드 라이팅 서비스 플렉슬 등 사내벤처를 통한 신사업 육성에도 힘쓰고 있다.

관련기사

한컴은 초연결성과 융합을 특징을 가지는 4차 산업혁명에서는 ICT기술을 기반으로 한 많은 플랫폼들이 만들어질 것이며, 이러한 플랫폼들이 모여 생태계를 이루며 성장 발전할 것으로 보고 있다. 한컴그룹은 그룹 내 SW기업과 또 외부 파트너사들 과의 생태계 만들어 4차산업혁명의 파고를 넘는다는 계획이다.

오는 29일 열리는 '독일 인더스트리 4.0을 통해본 한국형 4차산업혁명 미래 모델' 컨퍼런스에서는 한컴인터프리 장민 대표가 4차 산업혁명의 가장 큰 기술인 인공지능 기술을 기반으로 한 한컴의 소프트웨어의 생태계 전략을 소개할 예정이다. (☞ 프로그램 바로 가기)