“하둡과 RDB는 다르다. 그린플럼도 다르다”

김희배 한국EMC 데이터 컴퓨팅 사업부 이사

일반입력 :2011/10/28 08:40    수정: 2011/10/28 11:02

“DW업계 중 유일하게 그린플럼만의 전용 하둡을 만들었다. 그리고 하둡 어플라이언스를 내놨다. 이제 하둡과 관계형 데이터베이스를 한 장비에 담아냈다. 아직 어느 업체도 달성하지 못한 성과다. 그린플럼은 항상 한발 앞서나간다.”

김희배 한국EMC 데이터 컴퓨팅 사업부 이사는 기자와 인터뷰에서 이같이 밝히면서 데이터웨어하우스(DW) 시장공략에 강한 자신감을 보였다.

EMC는 지난달 관계형DB와 아파치 하둡을 한 장비에 넣은 그린플럼 DCA를 출시했다. 데이터웨어하우징(DW)업계 최초로 관계형 DB와 아파치 하둡을 단일 장비로 통합한 분석 어플라이언스다.

그린플럼 DCA는 모듈식 아키텍처로, 기업이 무공유 MPP 기반 관계형 DB와 엔터프라이즈급 아파치 하둡을 결합하도록 했다. 정형 데이터와 비정형 데이터의 상호 연계 처리가 가능하며 정형·비정형 데이터를 단일의 통합 플랫폼에서 필요에 따라 확장할 수 있다.

DCA 모듈은 작은 규모로 시작해, 쿼터랙 단위로 증가시키는 스케일링 방식을 사용한다. 처리 성능 및 스토리지 요구량에 따라 어플라이언스를 늘릴 수 있다. 그린플럼 DB와 그린플럼 HD(하둡) 모듈을 필요에 따라 상호 연계 처리 해 사용가능하며, 그린플럼 데이터 통합 가속기(DIA) 모듈을 통해 모든 BI 애플리케이션과 ELT 툴을 같은 DCA 내 클러스터로 바로 이동시킬 수 있다.

기본 랙은 2개의 마스터 서버로 이뤄진다. 마스터 서버는 인증, 쿼리 최적화, 각기 다른 세그먼트 서버간 업무량 분산, 데이터의 내장애성 메커니즘 관리를 담당한다. 단일 표준 혹은 고용량 그린플럼 데이터베이스 쿼터랙 모듈, 기타 3가지 모듈을 위한 공간이 포함된다. 기업은 그린플럼 DB, 그린플럼 HD 혹은 그린플럼 DIA 모듈을 사용해 쿼터랙을 증가시킬 수 있다.

그린플럼 DCA는 기존보다 가용성이 훨씬 높아졌으며 EMC 데이터 보호 및 재해 복구 솔루션, 데이터도메인 중복제거 및 백업 기술과 간단히 통합가능하다.

■DW 어플라이언스 시장 공세 나서

EMC는 지난해 그린플럼을 인수하면서 오라클, IBM 등과 결별하고 DW 어플라이언스 시장에 단독으로 나섰다. EMC는 이후 그린플럼 SW와 하드웨어를 통합하는 어플라이언스를 한달 반만에 출시했다.

김희배 이사는 “그린플럼은 x86서버 안정성이 좋지 않았던 2003년 창립 당시부터 병렬 서버로 MPP 어플라이언스를 만들어낸 회사”라며 “자체 성능 뿐 아니라 스케일 아웃 아키텍처에 맞는 기술을 갖고 있었다”라고 소개했다.

EMC는 또한 DW 시장 진출 직후 오픈소스인 아파치 하둡을 이용해 비정형 데이터를 효과적으로 관리하기 위한 솔루션 개발에 착수했다. 하둡과 유사한 맵리듀스를 적용했던 경험을 살려 인터커넥트를 만들고, 이번에 한장비에 담아낸 것이다.

현재 DW 어플라이언스는 비정형 데이터에 어울리는 솔루션에 전체 업계의 이목이 집중되고 있다. 테라데이타, IBM, 오라클 모두 비정형 데이터 관리를 위한 움직임에 적극적으로 나서 속속 솔루션을 내놓기 시작했다.

김희배 이사는 “타사들도 모두 하둡을 얘기하고 있지만, 그린플럼보다 아직 한발 뒤처져 있다”라며 “DCA는 하둡 클러스터만 따로 만들어서 관계형 DB와 하나로 묶어내는 DW다”라고 말했다.

■EMC 자체적으로 하둡 만든다

일단 경쟁사들이 나선 이상 그린플럼이 한발 앞섰다는 점은 잠깐의 장점에 불과하다. 그는 또다른 장점을 EMC가 자체적으로 하둡을 만든다는 사실을 들었다.

김 이사는 “핵심차이는 어플라이언스 출시에 있다기보다 그린플럼 하둡(GPDB)을 자체적으로 EMC가 직접 만든다는 것이다”라며 “클라우데라 같은 회사처럼 직접 하둡을 따로 만들어 사업을 벌인다”라고 강조했다.

그는 “EMC 하둡 부서는 야후 출신의 고급 인력을 데려왔더라”라고 덧붙였다.

그는 하둡에 대한 개인적 의견도 피력했다. 하둡 자체가 초반에 지나치게 관심을 끓어 부풀려졌었다는 지적이다.

그는 “시장이 본격적으로 시작도 하기 전에 부풀었다가 김이 빠졌다”라며 “지금은 실질적 필요에 의해 다시 부각되는 것이고 고객들은 매우 진지하다”라고 말했다. 이어 “이제 벤더가 솔루션을 내놓기 시작한 만큼 시스템 생태계가 생겨야 한다”라고 덧붙였다.

■그린플럼 고객사 꾸준히 확대할 것

자신감은 충분하다. 솔루션 성능에 자신을 가진 만큼 해볼 만하다는 판단이다. 그는 “누가나 다 비슷한 성능을 낼 수 있지만 고객의 기존 인프라와 무엇이 더 잘 맞나 봐야한다”라며 “시장 자체가 DB는 오라클과 MS기 때문에 당분간 이들이 먹히겠지만, 머지않아 힘을 발휘할 것이다”라고 말했다.

한국EMC는 올해까지 8개의 그린플럼 고객사를 확보했다. 올해 작년에 비해 두자릿수 고객 확보를 기대하고 있다.

아직 하둡과 DB를 밀접하게 사용하는 실제 사용자는 없다. 쉽다고 해서 하둡 도입을 고려하는 수준이다. 그러나 김 이사는 시장이 형성될 분위기와 요소가 이제 갖춰진 만큼 머지않아 하둡이 힘을 받을 것으로 예상했다.

관련기사

그는 “벤더의 제품이 나오고, 요소 기술을 이해하는 전문가도 많아져 저변이 넓어졌다”며 “ 생태계에 소프트웨어가 나오고, 컨설팅, 빅데이터 분석팀까지 나왔다”고 말했다. 그는 ““장이 설 요소는 충분하다”고 덧붙였다.

간단히 보지는 않는다. 관계형 DB는 오랜 시간 구축된 단단한 분야다. 김 이사는 “DB는 혈액형을 바꾸는 것이라 할 만큼 매우 크리티컬한 결정이다”며 “민감하지만 작은 시장이라 볼 수 없기 때문에 목숨걸고 하려 한다”고 마무리했다.