IBM 왓슨이 한국말을 뗀다는 의미는?

컴퓨팅입력 :2015/12/14 17:38    수정: 2015/12/14 18:02

현존하는 인공지능(AI)이 기업의 실무에서 생산성을 발휘할 수 있을까? 유행처럼 번지고 있는 AI에 대한 기업들의 주요 관심사다. IBM의 경우 작년초 '왓슨 그룹'이라는 이름으로 전담 사업 조직을 꾸리고 산업용 AI의 실용성을 입증하려 하고 있다. 한국IBM은 14일 서울 여의도 사옥에서 미디어데이 행사를 통해 코그니티브 컴퓨팅 분야에 초점을 맞춘 본사의 왓슨 사업 전략과 현황을 요약해 전했다.

IBM은 2014년 왓슨 그룹 신설 이래 10억달러 이상을 투자, 연구개발에 집중하면서 코그니티브 컴퓨팅 애플리케이션(이하 '앱')과 서비스를 출시해 왔다. 코그니티브 컴퓨팅 플랫폼 확산을 위해 파트너와 스타트업 협업을 추진, 외부 앱 개발에도 투자 중이다. 애플, 존슨앤존슨, 메드트로닉 등과 손을 잡고 소비자 및 의료 기기 최적화 지원에도 나섰다. 헬스케어 분석 강화를 위해 익스플로리스와 피텔을 인수했고 매사추세츠주 보스턴엔 전담 사업부 'IBM 왓슨 헬스'를 세웠다. 뉴욕 실리콘앨리 지역에 왓슨 글로벌 본부를 두고 세계 5곳에 왓슨 체험 센터를 개소했다.

IBM은 이날 미국, 캐나다, 호주, 영국, 남아프리카, 태국 등 24개국 17개 산업에서 왓슨 기술을 활용 중이며 개발자, 파트너, 기업가, 학생 수만명이 왓슨 기반 코그니티브 앱을 개발하고 의료, 유통, 재무, 법률, 교통, 교육, 보안 등 산업군에서 270곳 이상 파트너가 상업용 왓슨 앱을 활용한다고 자랑했다. 왓슨은 자연어 분석과 기계학습 기술로 소비자들의 상품구매 선호도나 취향을 파악하고, 수백만건의 과학 및 의학 논문을 단박에 분석해 의료, 제약, 과학 연구의 혁신을 돕고, 기존에 없던 요리법을 고안하거나 금융사 고객 대상 재무상담에까지 동원된단 설명이다.

그러나 이런 IBM 측에서도 AI에 대한 과도한 기대에는 선을 긋는다. 왓슨은 어디까지나 '잘 배우는 기계'로서 인간의 가르침을 필요로하는 존재라는 설명이다. 왜일까. 사람의 말을 기계가 알아들을 수 있는 형태로 처리하는 기술인 '자연어처리(NLP)'가 왓슨의 주요 특징을 이룬다. 왓슨은 인간의 언어로 만들어진 정보와 지식을 받아들여 근거에 기반한 가설 제시와 학습 등 일련의 인지적(cognitive) 사고 절차를 수행한다. 지식과 정보를 나타내는 인간의 언어는 다양하다. 왓슨이 활용 가능한 정보와 지식의 범주는 어떤 언어를 습득했는지에 따라 다를 수 있다.

한국어를 할 줄 모르는 왓슨. 한국 기업들에게 쓸모가 있을까? 이와 관련한 김연주 한국IBM 왓슨 비즈니스 총괄 상무는 왓슨의 NLP 기술과 현재 지원하는 언어, 습득 가능한 지식의 범주, 그에 따른 시장에서의 활용 가치 등을 다음과 같이 설명했다.

김연주 한국IBM 왓슨 비즈니스 총괄 상무

"(왓슨이) 올해 말이면 일본어 공부를 마친다. 우리는 '졸업'한다고 표현하는데, 향후 스페인어, 포르투갈어, 이탈리아어까지 나아가는 게 목표다. 안타깝게도 아직 한국어를 지원하지 않는다. IBM에서 한국을 주요 시장으로 바라보고 있기 때문에, 한국어(습득 수준)도 빠른 시일 안에 완성될 것으로 보고 있다. 한국어를 지원하지 않는 상황에서 한국 기업들이 왓슨을 도입하겠느냐는 의문이 들 수 있겠다. 용어 대부분이 영어 기반인 의료 및 제약 분야 업계에선 활용 가치가 있다. 외국 여러 곳에 시장을 보유한 기업들에게는 영어 버전만으로도 1차 도입을 희망하는 곳들이 있어 우리와 상담 중이다. 그리고 지금도 (왓슨 기반 소프트웨어 제품으로) 비정형데이터를 탐색하는 기능 등 일부는 (한국어 처리가) 가능하다."

뻔한 말이지만 쓰기 나름이라는 얘기다. 왓슨이 한국어를 할 줄 알면 한국 사업자들에게 더 유용할 수 있지만, 한국어를 못 한다고 영 쓸모가 없지는 않다는 설명이다. 의료나 제약처럼 고도의 전문성을 필요로하는 분야의 경우 이미 주류화한 언어가 더 중요할 수 있단 얘기로 들린다.

그런데 IBM이 말하는 왓슨의 언어 습득이 어떤 층위의 개념인진 불분명했다. 단지 영어 외의 언어로 자연어에 기반한 일반 사용자와의 소통이 가능해진다는 얘기일까. 아니면 왓슨의 핵심 능력인 전문지식 습득과 이해를 위한 원천 정보를 그 언어로도 받아들일 수 있다는 얘기일까.

IBM이 왓슨에서 지원하기로 예고한 한국어에 대해서도 같은 의문을 떠올릴 수 있다. 왓슨이 한국어를 지원한다는 표현은 일반인과 대화할 수 있는 수준이라는 것일까, 또는 전문가들의 어휘와 개념을 포함한 한국어 정보를 처리하고 추론과 분류까지 할 수 있다는 의미일까?

왓슨의 한국어 지원은 후자보다는 전자에 가까운 수준을 가리킨다. 한국어 정보 분석을 통한 전문지식 습득은 별개다. 현재 왓슨이 주력한다고 강조하고 있는 의료 및 제약 분야는 영어로 된 전문지식을 누적 습득한 결과인데, 영어는 단지 그 기반 언어일 뿐 일반인들이 소통하는 일상 언어로서의 영어와는 또 별개다.

같은 이유로, 한국어를 지원하지 않는 왓슨이라도 이미 축적된 전문지식을 활용 가능한 특정 산업 분야 기업에선 왓슨을 도입할 여지가 있다. 거꾸로 왓슨이 한국어를 이해할 수 있다는 사실을 모든 한국기업의 실무에 당장 투입할 수 있게 됐다는 식으로 이해해선 곤란하다. 한국어 지원은 왓슨이 한국어를 통용할 수밖에 없는 특정 산업 분야에서의 전문 지식 습득을 위한 바탕일 뿐이다.

김 상무는 왓슨의 한국어 지원과 관련된 질문의 답변을 다음과 같이 끝맺었다. 기계학습을 통한 성숙 과정에 도달하는 게 기업의 AI 활용 성패에 중요하다는 뉘앙스였다. 왓슨을 비롯한 현존 AI의 일반적인 특징을 시사한 것이다.

관련기사

"업종에 따라 차이는 있지만, 어느 회사든 신입사원을 들이면 교육이나 연수 과정을 거치잖나. 사람이 해당 분야 실무에서 다루는 정보와 지식을 습득하고 자연스럽게 받아들이고 업무에 활용할 수 있기까지는 일정한 시간이 걸린다. 왓슨도 마찬가지다. 할 줄 알게 되게끔 가르치는 과정이 필요하다. 그건 비즈니스에 목적이 뚜렷한 기업에서 수행해야 하는 일이다. 도입한다고 어떤 기업에서 당장 비즈니스에 적용할 수 있는 AI? 그런 건 존재하지 않는다."

이는 AI를 만들기 위해 필요한 현 기계학습 방법론의 한계로 볼 수 있다. 기계학습은 처리 결과를 습득하는 과정에 사람이 개입하는 '지도학습'과, 스스로 값을 부여하거나 개념을 분류하는 '비(非)지도학습'으로 나뉜다. 100% 비지도학습이 가능하다면 AI는 스스로 모든 지식을 습득하면서 진화할 수 있지만, 이는 아직 실현되지 않았다. '당장 현업에 적용할 수 있는 AI같은 건 실재하지 않는다'는 게 이런 얘기다.