오픈소스 통계분석 엔진 'R' 뜬다

일반입력 :2011/09/02 11:12    수정: 2011/09/02 11:32

김효정 기자

그 동안 SAS, SPSS 등이 주도하던 기업용 통계분석 솔루션 시장에 강력한 도전자가 등장했다. 오픈소스 기반으로 가격 경쟁력을 갖추고 있으며, 이미 학계에서 널리 쓰이고 있는 데이터 분석엔진 'R'이 그 주인공이다. 기업 시장에서도 R에 대한 수요가 증가하면서 기업용 버전(상용)을 공급하는 국내 파트너가 시장 공략에 나섰다.

빅 데이터 분석 전문회사인 베가스는 2일 R의 기업용 버전을 공급하는 레볼루션어낼리틱스(이하 RA) 사의 제품을 국내 시장에 공급하겠다고 밝혔다. 쉽게 말해, RA는 오픈소스인 리눅스 상용 버전을 공급하는 '레드햇'과 같은 회사이다. 주목할 점은 RA의 CEO가 전 SPSS의 CEO인 노먼 나이(Norman H. Nie)로 R 코드를 개발한 사람이다.

R은 그 모태가 미국 벨랩에서 개발한 'S' 프로그래밍 언어로 데이터, 분석함수, 분석결과 등을 모두 객체로 인지하는 데이터 분석용 객체지향 프로그래밍 언어이다.

R은 S의 GNU버전으로 90년대말 개발이 시작되어 대학교, 연구소, 바이오산업을 중심으로 활발히 사용되다 2000년대말 구글, 페이스북, 아마존, 야후 등의 빅 데이터 처리 회사들의 기본 분석플랫폼으로 사용되는 것이 알려지며 많은 기업들이 분석 업무에 도입하기 시작했다.

최근 R은 무료지만 고성능에 빅 데이터 처리에 유리하고 각종 API 제공으로 타 SW와의 연동이 용이함이 알려지며, 고가의 분석 패키지인 SAS 등을 대체하는 추세가 미국, 유럽을 중심으로 나타나고 있다.

국내 대학에서도 R이 활발히 사용되고 있으며, 기업에서도 이를 주목하기 시작했다는 것이 베가스 측 설명이다. 마치 위키피디아처럼 200만여명의 R 사용자들이 커뮤니티에 접속, 다양한 산업분야에 특화된 3천여개의 공개 패키지를 만들어 주목 받고 있다. 여기에 저렴한 가격으로 기업용 버전 공급이 시작되면서 차츰 시장이 열리게 될 것으로 보인다.

이날 방한한 제프 에어하트 RA COO는 R 상용버전의 가격은 SAS 베이스(기본형)의 절반도 안되는 반면, 모든 기능을 제공한다고 말했다.

이어 이재형 베가스 부사장은 R 상용 제품은 대용량 데이터 분석, 신뢰성, 컴퓨팅 속도 등 기존 공짜 R 버전의 문제점을 해결했기 때문에 경쟁력을 갖추었다고 설명했다.

특히 R의 강점은 최근 클라우드 컴퓨팅으로 업계의 핫이슈로 떠오른 하둡과의 연계성이다. 대용량 데이터 처리 분석을 위한 분산 컴퓨팅 오픈소스 소프트웨어인 하둡을 지원한다는 점에서 업계는 R에 주목하고 있다.

RA사는 하둡 환경에서 R을 사용할 수 있는 라이브러리를 올해 출시할 예정이다. 이외에도 마이크로소프트위 윈도 환경 하에서 고성능 컴퓨팅을 지원하고, IBM 네티자가 인메모리, 인데이터 엔진으로 R을 사용하고 있음을 소개했다.

관련기사

에어하트 COO는 화이자, 시티은행, 뱅크오브아메리카, 머크 등을 포함 수많은 레퍼런스를 이미 확보했다며 한국 시장에서도 R의 빠른 확산을 기대했다. 이미 베가스는 LG디스플레이의 공정에 품질분석 솔루션으로 R을 테스트하는 등 제조 및 금융권의 레퍼런스 확보를 눈 앞에 두고 있다.

강윤혜 베가스 대표는 R의 고성능의 컴퓨팅 성능, 3천개 이상의 공개 패키지에 의한 최신의 분석 알고리즘, 분산처리 기능에 의한 확장성에 기반해 RA 사가 제공하는 기업용 R을 통해 국내 고객들이 분석의 ROI를 향상시키고, 고품격의 분석 컨설팅을 선보이겠고 말했다.