한국어 시리, 말귀 어둡다?…"시간이 약"

일반입력 :2012/11/09 08:29    수정: 2012/11/09 08:56

애플 시리가 한국어로도 유창하게 말문을 텄지만, 그와 대화해 본 사용자들 소감에 따르면 '말귀'가 어둡다. 당장 국내서는 터치 입력을 대체하는 음성 인터페이스 정도로 쓰일 뿐 그 뒤에 연계된 기술의 진가를 발휘하지 못하고 있다.

시리의 역할은 iOS 기기에서 사용자 말소리를 받아 문자 언어로 바꾸고, 그 내용을 이해해 알맞은 정보를 제시하거나 적절한 기능을 수행하는 것이다. 전화를 걸고 메시지를 전달하고 일정이나 연락처를 관리할 뿐아니라 장소와 교통편 예약을 맡아주기도 한다. 여기에 사용자와 농담하는 등 정서적인 대화가 가능해 인공지능 비서 애플리케이션(이하 '앱')으로 묘사된다.

이를 위해 애플은 시리에 음성인식과 합성, 시맨틱검색과 자연어처리 기술 등을 녹인 것으로 알려졌다. 이가운데 음성인식을 제외한 나머지 기술들은 단지 기기 조작이나 정보 검색 목적이 아니라 '자연스러운 대화'를 위해 활용된다. 이같은 시리의 특징이 미국 사용자들에게 호평을 받은 것과 달리, 우리나라에선 실망스럽다는 반응이다.

오히려 경쟁사들이 시리를 의식해 선보인 대응 서비스가 한국어 사용자 환경에선 더 뛰어나다는 지적도 있다. 다만 국내서 시리의 부진함을 해결하는 건 '시간문제'라는 게 관련업계 전문가의 분석이다.

■시리 한국어 버전에 실망한 이유

사실 시리에게 한국말로 욕을 하면 못 들은 체 하기도 하고, 사랑을 고백하면 안타깝다는 반응을 보이기도 하며, 좋지 않은 기분을 드러내면 사과하기도 한다.

다만 이는 복잡하지 않은 '낱말' 형태의 표현을 받아들여 예약된 답변들을 내보내는 수준이다. 문장이 길거나 구조가 복잡한 표현을 입력받으면 말귀를 못 알아듣고 들린 문장 그대로 인터넷 검색을 해버린다. 그 빈도가 영어에 비해 너무 높아 문제다.

한국어 시리에 대한 불만스러운 평가는 지난 9월 개발자용 시험판으로 선보였을 때부터 있었지만 지난달 정식서비스로 나온 이후에도 뒤집히지 않았다.

최근 인터넷 게시판 등에서는 시리는 한국어보다 영어로 쓰는게 속이 덜 터지겠다며 전화를 걸라 해도 사람을 인식하지 못해 속터진다고 지적했고, 난 토종 한국사람인데 한국어 시리는 (내 말을) 어떻게 하나도 못알아듣냐며 영어로 바꾸니까 잘 알아 듣는데 한국어 시리는 바보라는 글들이 올라왔다.

아이폰5와 그에 탑재된 iOS6 버전 공개와 함께 한국어 시리가 정식 서비스 중이지만 칭찬을 찾아보기 어렵다. 그나마 시험판 때보다 인식률이 좋아졌다는 게 호평이다.

시리를 쓰는 한 사용자는 8시에 깨워달라고 하면 알아듣는데 8시12분에 깨워달라고 하면 설정한 시각에서 12분 뒤에 알람을 설정한다며 한국어 시리는 실망스럽다고 말했고, 또다른 사용자는 시리가 외국인이라 그렇다며 한국어에 대한 반응 수준이 영어에 비해 뒤쳐졌음을 꼬집었다.

■한국말 음성서비스, 한국업체가 잘한다?

오히려 애플보다 뒤늦게 유사 서비스를 선보인 국내 기업들이 한국어 인식률을 강조하고 있다. 아직 국내시장에 파고들지 못한 시리를 추월하려는 움직임이다. 앞서 삼성전자가 'S보이스'를, LG전자가 'Q보이스'를 자사 안드로이드 단말기에 담았고 검색포털 네이버도 지난 2010년 공개한 음성검색기술 '링크'를 이달 중순께 별도 앱으로 내놓기로 최근 예고했다.

그런데 말소리를 듣고 결과를 다시 말소리로 내보내는 '음성인식'과 '음성합성'은 전체 서비스를 놓고 보면 보조적인 영역이다. 애플은 뉘앙스, 삼성은 블링고 솔루션으로 해당 분야 기술을 메웠는데, 현재 뉘앙스가 블링고를 인수함으로써 양사는 같은 업체의 음성기술을 쓰는 셈이 됐다. LG전자도 음성인식 영역은 구글의 기술을 쓴 것으로 알려졌다.

사실 시리같은 사람과 기계의 대화형 서비스에서는 의미 해석의 정확성과 적절한 반응 수준을 근본적 차별화 요소로 보게 된다. 업계에 따르면 그 품질을 높이기 위해 특성이 제각각인 각 언어마다 별개의 발전이 이뤄져야 한다. 타 언어 서비스로 갖춘 노하우를 그대로 적용하긴 어렵다는 것이다. 애플이 시리 서비스를 처음부터 모든 제품 출시 대상 국가에 내놓지 못한 이유다.

자연어 기반의 대화형 서비스를 구현하려면 방대한 데이터베이스(DB)를 갖춰야 한다. 각 언어별 검색기술로 상황별 콘텐츠를 수집 분류하고, 실제 사람들이 질문을 던진 사례를 유형화해 결과물이 얼마나 믿을만한지 판단케하는 통계분석 방식으로 답변의 적절성을 높여야 한다. 수집대상에는 현지에서 통용되는 고유명사와 비공식적 어휘를 망라해야 하며 자연스러운 의미 파악을 위해 형태소분석과 같은 언어학적 기법도 동원된다.

■사용자 규모와 시간만이 답

이는 해당 지역언어를 의미기반으로 처리하는 노하우를 갖춘 현지 검색업체가 잘 할 수 있는 영역이다. 실제로 수많은 사람들이 검색한 사례를 자연스럽게 쌓아온 네이버, 다음, 네이트 등 검색포털이 그 품질을 발전시킬 수 있는 기반을 비교적 쉽게 갖춰왔다. 시리를 의식해 등장한 네이버 링크가 '10년이상 쌓인 한국어 사용자 검색 데이터'를 강조하는 배경도 그 누적된 노하우를 한순간에 따라잡기 어렵다는 판단에서다.

반면 애플은 자체 검색서비스 없이 주요 질의 결과를 구글과 울프램알파 같은 외부 사이트에 의존하고 있다. 구글은 국내 검색 점유율이 낮고 울프램알파는 한국어 질의를 못 다룬다. 당장 시리의 한국어 이해력이 떨어지는 이유다.

그렇다고 끝난 게임은 아니다. 현재 모바일기기를 통해 제공되는 시리, S보이스, Q보이스 등이 공통적으로 사용자가 원하는 내용을 계속해서 자체 서버에 쌓아가고 있다. 당장 구현된 검색기술과 인식률보다 실제 사용사례를 통해 쌓이는 DB를 유형화함으로써 한층 정교한 대화형 서비스를 만들어갈 여지가 충분하다. 얼마나 방대한 데이터를 모아서 결과 품질을 빠르게 높여갈 것인가가 관건이다.

관련기사

8일 시맨틱검색업체 다이퀘스트의 김경선 기술연구소장은 여러 업체들이 음성인식과 자연어처리기술을 결합해 데이터를 처리하는 과정 자체는 동일할 것이라며 차별성은 처리엔진의 성능과 그 수집된 사례들의 정교함에 달렸다고 설명했다.

그는 이어 사람의 말을 기계가 알아듣도록 일일이 유형 분석과 통계처리를 해줌으로써 정교함을 높일 수 있는데 이는 시간이 해결해줄 문제라며 각사마다 사용자의 동의를 받고 검색 내용을 수집해 활용중이라 점차 나아질 수밖에 없다고 덧붙였다.