네이버 품에 안긴 XRCE, 어떤 AI기술 가졌나

머신러닝-자연어 처리 강점…20년 연구성과 탁월

인터넷입력 :2017/06/28 14:24    수정: 2017/06/29 16:03

손경호 기자

네이버랩스유럽으로 탈바꿈한 제록스리서치센터유럽(XRCE)은 인공지능(AI) 분야에서 20년 이상 연구성과를 쌓아 온 연구소다. 일반인들에겐 생소하지만 AI 연구분야에선 손에 꼽히는 곳 중 하나다.

이에 따라 네이버 품에 안긴 XRCE가 어떤 기술 DNA를 심어줄 수 있을 지에 관심이 쏠린다.

XRCE의 핵심 연구 분야로는 컴퓨터비전, 자연어 처리, 머신러닝 등을 꼽을 수 있다. 그동안 NIPS, CVPR, ACL, ICML 등 유명 저널, 컨퍼런스 등에 논문을 발표하면서 연구 성과를 널리 인정받아 왔다.

1993년 설립된 이 연구소는 초기엔 종이와 컴퓨터 화면을 하나로 섞은 디지털데스크를 고안했다. 일종의 증강현실(AR) 기술을 구현한 이 기기는 책이나 종이문서의 내용들을 컴퓨터 화면에 복사하는 등 기능을 가졌다.

이 시기 XRCE는 지금의 검색엔진 시초인 메타서치엔진에 대한 콘셉트를 구상하기도 했다. 또한 모바일 기기가 어떻게 하이퍼링크를 공유할 수 있는지, 사람들이 그들의 맥락에 기초해 정보를 검색할 수 있는지 등에 대한 연구도 진행했다. 이미지를 종류에 따라 분류해낼 수 있는 상업용 이미지 카테고라이저를 개발하기도 했다.

■ 어떤 사진이 더 미학적인지 분간한다

최근까지 XRCE는 컴퓨터 비전, 자연어 처리, 머신러닝에 집중해 연구성과를 냈다.

먼저 컴퓨터비전에 대해 이 연구소는 "자동화된 프로세스에 시각(sight)을 부여할 수 있는 기술을 제공한다"고 설명했다. 그 중에서도 이미지로부터 텍스트 정보를 추출하는 기술을 오랫동안 연구해 왔다. 예를 들어 OCR(광학문자판독기)이나 사람이 직접 쓴 글로부터 텍스트를 뽑아내는 경우가 그렇다. 웹페이지, 내부 데이터베이스 등에서도 텍스트를 추출한다.

XRCE는 사진, 의료영상, 스캔한 문서, 동영상 등으로부터 시각적 표현을 배우고, 이미지 검색, 사물 탐지, 동영상 분석, 시각적 분류, 이미지의 미학적인 면을 평가하는 방법 등에 대한 연구도 진행했다.

에스테틱 이미지 검색 화면. 사진에서는 꽃을 주제로 어떤 사진이 더 미학적으로 좋은 퀄리티를 가졌는지를 평가했다.(자료=네이버랩스유럽)

이를 구현한 '에스테틱 이미지 검색'은 어떤 이미지가 더 미학적으로 주제를 더 잘 표현하고 있는지 까지도 분간해낸다.

이를테면 꽃을 주제로 검색하면 이 연구소가 개발한 알고리즘은 전체 화면에 꽃이 꽉 차있고, 검은 배경 위에 꽃을 표현하는게 더 효과를 극대화시킨다고 설명한다.

자연어 처리 분야에서는 그동안 컴퓨터가 자연어를 읽고 이해해서 어떤 행동을 이끌어낼 수 있도록 하는 것을 목표로 연구를 진행해 왔다. 특히 단순히 자연어를 이해하는 수준에서 그치지 않고 어떤 행동을 유도할 수 있도록 하는데 방점을 찍었다. 이 연구소는 헬스케어, 각종 소송, 자동화, 금융 분야에서 텍스트 분석 애플리케이션에 이러한 알고리즘과 모델을 적용했다.

■ 머신러닝, 교통요금-의료보험청구서 등 처리 효율성 높여

머신러닝 분야에서는 수많은 센서, 소셜미디어, 기타 여러가지 정보들을 활용해 최적의 의사결정을 할 수 있도록 돕는데 집중했다.

XRCE는 머신러닝 연구를 두 갈래로 진행했다. 먼저 예측분석은 미래에 더 나은 의사결정을 할 수 있게 돕는 알고리즘과 모델을 개발한다. 지식발생은 기존 데이터를 활용, 전에 없던 새로운 지식을 만들어 내는 것을 목표로 한다.

이를 위해 시공간 데이터 모델링, 매커니즘 디자인, 통계적 관계 추론, 지식 전이, 순차적 의사 결정 모델을 연구했다.

이 중 시공간 데이터 모델링은 예를 들어 공공교통데이터, 에너지소비데이터, 소셜네트워크 콘텐츠 등 실제 세계의 네트워크에서 특정한 트렌드를 예측한다.

XRCE의 모회사였던 제록스는 일반적인 프린터 외에도 교통관리솔루션, 헬스케어솔루션 등을 개발해 서비스해왔다.

관련기사

이 연구소에 따르면 제록스는 그동안 연간 370억건의 교통요금 징수와 9억건 가량 의료보험청구서 처리, 고객센터에서는 매일 150만건의 요청을 해결해왔다.

여기에 XRCE가 개발한 데이터처리, 모델링, 데이터 기반 의사결정 기술이 현실 세계에서 더 빠르고 효율적으로 이러한 업무를 처리할 수 있게 지원해왔다고 강조했다.