클라우드 머신러닝 레이스 3파전 불붙었다

일반입력 :2015/04/16 08:20

퍼블릭 클라우드 시장 패권을 놓고 치열하게 경쟁하고 있는 아마존, 마이크로소프트(MS), 구글이 이번엔 클라우드 위 머신러닝 서비스 분야에서 싸움을 시작했다. 2010년 부터 프리딕션API라는 서비스를 선보인 구글에 이어 올해 2월 MS가 정식으로 머신러닝 서비스를 선보이고 여기에 아마존까지 지난 주 아마존웹서비스서밋을 통해 머신러닝 서비스를 공개하면서 3파전이 본격화됐다.

클라우드 위 머신러닝 전쟁에서 승기를 잡는 쪽은 누가 될까? 데이터베이스 및 비즈니스인텔리전스 분야 전문가이자 IT칼럼리스트인 엔드류 브루스트(Andrew Brust)는 미국 지디넷에 기고를 통해 3 업체에서 제공하는 머신러닝 서비스를 비교 분석했다. 그의 설명에 따르면 예측 분석을 수행하고자 할 때 어느 업체를 사용하든 상당한 혜택을 볼 수 있을 만큼 모두 괜찮은 제품이지만 각각 서비스의 장단점은 있다.

MS-아마존이 불붙인 머신러닝 경쟁

클라우드 위 머신러닝 서비스에 대해 가장 눈에 띄는 투자를 보이는 건 MS다. MS는 지난해 7월 애저 머신러닝(애저ML)이라는 머신러닝 서비스를 처음 공개한 데 이어 올해 초 서비스를 정식 출시했다. 이달 7일에는 R프로그래밍 언어 분야의 막강한 파워를 가지고 있는 레볼루션 애널리틱스를 인수하며 머신러닝 관련 서비스를 강화하겠다는 의지를 또 한번 보였다. 레볼루션애널리틱스는 오픈소스R프로젝트에서 가장 중량감 있는 컨트리뷰터로 꼽히는 동시에 레볼루션R이라는 기업용 통계 분석 솔루션을 보유하고 있다. 레볼루션R은 대규모 데이터웨어하우및 하둡 시스템과 통합가능 한 것이 특징이다. 오픈소스 R프로그래밍 언어로 짜여진 코드와도 잘 통합된다.

가장 강력한 클라우드 고객 기반을 가진 아마존까지 이달 10일 사용하기 쉬운 머신러닝을 표방하며 아마존 머신러닝(아마존ML)이라는 제품을 발표했다.

구글이 2010년 처음 클라우드에서 머신러닝 기능 소개하며 포문을 열었다면 최근 MS와 아마존이 공격적으로 뛰어들며 판이 커지는 형국이 만들어졌다.

3업체 모두 믿을 만한 기술 기반 자랑

3업체 모두 제공하고 있는 머신러닝 서비스가 자신들이 내부적으로 사용하는 것과 같은 기술 기반 아래 만들어 졌다는 점을 강조하고 있다.

아마존은 이커머스 비즈니스에 예측분석 모델을 적용해 고객이 필요한 물건을 정교하게 추천해 주고 있다. 구글은 핵심 서비스인 검색에 예측 로직을 적용하고 있다. MS 역시 검색 서비스인 빙과, 엑스박스 등 다양한 서비스에 머신러닝 기술을 적용했다고 한다. 기술 역량으로 보면 3 곳 모두 누구나 탐낼만한 기반을 가지고 있는 건 분명해 보인다.

데이터 소스 측면에서 보면 3개 퍼블릭 클라우드 제공 업체들은 핵심 스토리지 서비스, 그리고 한 개 그 이상의 데이터베이스 제품에 머신러닝 상품에 연결해 제공하고 있다.

아마존ML은 S3 스토리지, 클라우드 기반 데이터웨어하우스 ‘레드시프트(Redshift)’, MySQL에 머신러닝을 연결해 제공하고 있다. 구글은 프레딕션API를 구글클라우드스토리지, 빅데이터 분석 서비스 ‘빅쿼리(BigQuery)’에 연결시켰다. MS는 테이블 및 BLOB 스토리지 서비스와 SQL데이터베이스, 하둡 하이브 테이블, OData(OPEN DATA Protocol)도 지원한다.

클라우드 위로 올라간 머신러닝...'쉬워졌다'

3업체 머신러닝 서비스 모두 동작 방법은 유사하다. 데이터를 읽으면 예측 모델 구축을 지원한다. 개발자들이 변수 값 인풋을 보내면 대상 변수에 대한 예측 값을 받을 수 있는 API들을 제공한다. 어떤 클라이언트 애플리케이션이라도 단일 웹서비스 콜을 만들어 예측해 볼 수 있다.

예를 들면 성별, 수입, 나이, 직업 같은 인구통계학적 특성에 따라 특정 상품을 구입할 가능성이 얼마인지 상관관계를 따져보는 모델을 만들어 볼 수 있다. 머신러닝 서비스를 가지고 웹 서비스 콜을 만들고, 입력 매개 변수로 인구통계학적 데이터를 집어넣고 반환 값으로 구매할 가능성에 대해 ‘Yes or No’라는 예측결과를 받아보는 게 가능하다.

차이점은 없나?

클라우드 머신러닝 서비스 마다 차이점도 있다. 먼저 약간의 단점을 언급하자면, 구글 프리딕션API는 사용자인터페이스(UI)가 없다. MS와 구글은 모델을 구축하는데 선택할 수 있는 알고리즘이 여러개 있다면 아마존ML은 단 한개의 알고리즘만 제공한다.

차별화된 장점도 있다. UI측면에서 MS는 순서도 스타일의 데이터 플로우를 제공한다. 아마존은 UI 지원은 미흡하지만 마법사 형태로 매우 쉽게 사용할 수 있다는 장점이 있다.

그래서 빅 3 중 승리자는 누구일까?

아마존의 장점은 많은 기업들이 AWS에 상당한 양의 데이터를 저장하고 있고 S3 스토리지에 연결돼 있다는 점이다.

구글은 머신러닝 분야에서 높은 평판을 가지고 있다는 점이 강점이다. 자신들의 핵심 비즈니스에 기술을 사용해 입증했다는 거다.

관련기사

MS의 서비스는 유연하고 연결성이 좋다는 게 강점이다. 하둡과 통합을 제공하는 유일한 제품이기도 하다. 만약 MS가 레볼루션 애널리틱스의 기술을 애저ML에 잘 엮어 낸다면 지금보다 더 강력한 기능을 이끌어 낼 수 있을 것으로 기대된다.

이제 막 3업체가 본격적으로 클라우드 위 머신러닝 서비스 경쟁에 돌입한 만큼 승자를 예단하기 어려운 상황이다. 엔드류 브루스트는 “사용자들이 다른 데이터 처리 작업을 하기 위해 가장 자주 사용하는 클라우드 서비스에서 머신러닝 서비스도 사용할 가능성이 많다”고 강조하며 3업체 모두 다른 데이터분석 서비스와 머신러닝 서비스가 상호호환 될 수 있도록 적극적으로 통합 확장 할 필요가 있다고 주문했다.