구글 “터치 아닌 말로 하는 시대 온다”

웨어러블 확산맞춰 음성인식 신기술 '앤써' 선봬

일반입력 :2014/12/04 14:02    수정: 2014/12/04 17:46

“이제는 터치가 아닌 음성으로 모든 것이 가능한 시대가 된다.”

구글이 웨어러블 기기의 발전에 맞춰 고도화된 음성 기술을 선보였다.

구글코리아는 4일 서울 역삼동 본사에서 ‘보이스 온 모바일’ 미디어 라운드테이블을 열고 새로운 음성 기반 기능인 ‘음성 앤써(답변)’와 ‘음성 액션(행동)’을 소개했다.

구글 음성 기능은 단순한 음성 인식과 음성 검색 기능을 넘어 ▲검색 ▲앱 실행 ▲문자와 이메일 전송 ▲전화걸기 ▲일정등록 ▲리마인더 설정 등 다양한 명령을 내릴 수 있다. 또 자연어 음성 질문에 대해서는 비교적 정확히 인식하고, 이를 직접 음성으로 답을 해준다. 구글 측에 따르면 구글의 음성 기술은 애플 시리보다 높은 정확도를 자랑한다.

현재 구글의 새로운 음성 기능은 미국·영국·프랑스·독일·일본 등에서 동일하게 적용된 상태며, 국내에는 최근 도입됐다.

구글에 의하면 음성 검색의 다양한 기능들이 소개되면서 올해 모바일 음성 검색 사용률은 작년에 비해 2배 증가했다. 또한 미국의 경우 스마트폰 및 태블릿 사용자 10명 중 5명이 이같은 음성 기반 기능을 알고 있으며, 이들 중 33%가 이미 음성기반 검색 및 액션을 사용하는 것으로 나타났다.

구글의 음성 검색은 지난 2008년 미국에서 첫 선을 보였다. 한국에서는 2010년 6월 처음 소개됐으며 긴 문자열 입력·보행·운전 등 손으로 문자 입력이 어려운 상황에서 손쉽게 입력이 가능하게끔 설계됐다. 구글의 음성인식 기술은 기계학습을 통해 사용량이 많을수록 품질이 올라가는 특징을 지녔다.

안드로이드 기기의 경우 기본 설치된 구글앱을 통해, 아이폰의 경우 구글앱을 내려받아 구글 음성 검색 기능을 활용할 수 있다. 구글 검색창의 우측 마이크 버튼을 누르면 음성 인식모드로 전환되며, 안드로이드 4.4 버전 부터는 잠금을 푼 상태에서 “오케이 구글”이라고 말하면 바로 음성 인식 모드로 전환된다.

앞으로는 구글의 음성 인식 기술을 활용해 사용자는 모바일 기기와 대화할 수 있게 될 전망이다. 단순한 검색어를 말로 불러주는 것 이외에 다양한 질문과 명령을 모바일 기기에 전달할 수 있으며, 질문에 대한 답변을 음성으로 들을 수 있다. 또한 단어와 단어로 이뤄진 전형적인 검색어가 아닌, 평상시 사용하는 구어체인 ‘자연어’ 인식을 통해 문맥을 파악한 후 대답한다. 문맥을 통해 대명사가 누구를 가리키는지까지 찾아낸다.

이날 미디어 라운드테이블에서 공개된 음성 앤써는 자연어 질문에 대한 답을 주는 기능이다. 예를 들어 ▲오늘 날씨는? ▲이백구십오 곱하기 삼십칠 더하기 팔은? ▲10마일은 몇 킬로미터? 와 같은 질문을 하면 해당 문구로 검색을 해주는 것이 아니라 이에 대한 답을 보여주고, 읽어준다. 날씨의 경우는 사용자의 현재 위치를 파악해 해당 지역의 날씨를 알려준다.

음성 액션은 각종 앱, 기능들을 실행 시키는 명령어 인식 기능이다. 예를 들어 ▲검색 ▲지도앱 실행 ▲문자 및 이메일 전송 ▲전화걸기 ▲일정등록 ▲리마인더 ▲블루투스 켜기 등 앱 실행과 설정을 간단하게 음성으로 처리할 수 있다.

다른 일반 앱 실행은 해당 개발사가 공개된 API를 활용하면 구글 음성 기능을 도입할 수 있다. 현재 여러 개발사들이 구글 음성 기술 도입을 검토 중인 것으로 알려졌다. 이렇게 되면 ‘카카오톡’이나 ‘페이스북’ 등과 같은 다양한 앱도 일반 구글 앱처럼 음성으로 실행시키고 명령을 내릴 수 있다.

구글 음성 액션은 “남편에게 전화 걸어”란 명령어로 전화를 걸거나 “지금 차가 막혀서 회의에 좀 늦을 것 같아요”란 메시지를 문자로 전송하는 등을 실행하는 데 활용할 수 있다. 운전을 하고 있는 상태에서 휴대폰을 만지기 힘들 때 편리하게 사용될 수 있다. 예전보다 높아진 인식 기술이 적용돼 오류가 크게 낮아졌다.

구글 모바일 검색 부문 스티브 챙은 “이용자들의 요청이나 질문을 정확히 파악하면서 음성 기능을 활용하면 정보 접근이 과거보다 훨씬 용이해진다고 보고 있다”면서 “구글 음성 기술은 정확한 답을 전달하고 이용자의 맥락에 따라 미리 정보를 제시해줌은 물론, 자연스런 언어로 질문을 받고 답을 해주는 대화형태가 될 것”이라고 말했다.

관련기사

구글코리아 이해민 프로덕트 매니저는 “음성 인식 서비스는 국내에 2010년부터 제공돼 왔고 그간 많은 발전을 이뤄왔다”며 “지금은 속삭이듯 말을 해도 알아듣는 수준에 이르렀다. 이를 통해 사용자 경험이 완전히 뒤바뀔 수 있다”고 밝혔다.

또 “구글글래스, 스마트워치, 무인자동차 등 구글이 준비 중인 혁신적인 기기들과 사람이 어떻게 대화할 수 있을까를 내다보고 음성 기능들이 고도화 되고 있다”면서 “한글 특성상 기계가 학습하기 좋은 언어다 보니 국내 음성 인식 수준이 타 지역에 비해 뛰어난 수준인데 사용자가 더 많이 사용할수록 품질은 훨씬 더 발전하게 될 것”이라고 설명했다.