CA "하둡 빅데이터도 관리해주마"

일반입력 :2013/04/24 08:23

[라스베이거스(미국)=임민철 기자]CA테크놀로지스가 빅데이터 대응 전략의 일환으로 오픈소스 하둡 기술 생태계에 발을 담그겠다는 뜻을 내비쳤다. 그간 회사가 엔터프라이즈 IT관리기술 시장에 집중해온만큼, 거대 조직들의 하둡 도입사례가 관리기술 시장을 형성할 만큼 늘어난 것으로 풀이된다.

하둡은 빅데이터 분석의 바탕이 될 요소기술로 주목되는 분산데이터처리용 오픈소스 소프트웨어(SW)다. 프레임워크 형태로 배포되는데 이를 값싼 서버 장비 여러대에 설치해 연결하고 대용량 데이터를 저장하는 식으로 쓴다.

하둡은 이론적으로 비싼 고성능 분석장비에 준하는 데이터 일괄처리 성능을 낼 수 있다. 당장은 그만큼 편리한 기술은 아니지만, 이를 잘 다룰 전문가 수요는 급증 추세다.

마이클 그레고어 CA 최고경영자(CEO)는 23일 미국 라스베이거스 만달레이베이리조트 CA월드2013 현장에서 우리는 (하둡) 배포판 업체가 되거나 그 기술을 사용하려는 건 아니지만 이를 관리하게 될 것이라 말했다.

CA는 오픈소스기반 제품을 공급하지 않는다. 단지 기존 IT관리 전략의 연장선에서, 업계에 확산되고 있는 하둡 사용환경도 '관리대상' 범주에 넣겠다는 입장이다. 자사 빅데이터 통합 관리전략의 일환이다.

사실 그레고어 CEO는 하루 앞서 지난 22일 CA월드2013 첫 기조연설 말미에도 빅데이터 전략과 함께 하둡을 의미심장하게 언급했다. 하둡 프레임워크 데이터에 무결성과 기밀성을 지원하는 보안 전략에 초점을 맞춰 '빅데이터를 위한 킬러 애플리케이션을 마련하겠다'는 예고였다.

하지만 이 얘기만으로는 대체 무슨 뜻인지 불분명하다. 간단히 하둡이라는 기술을 관리한다는 얘기로 이해하기엔 앞뒤가 맞지 않는다. 오픈소스 기술은 후원사를 포함한 개발자 커뮤니티에서 관리하지만, CA가 스스로 밝혔듯이 회사는 오픈소스 업체가 아니다.

같은 자리의 다른 발언을 통해 좀 더 구체적인 의미를 짐작해볼 수 있다.

그레고어 CEO는 하둡 오픈소스 데이터베이스(DB)는 빅데이터 저장소라며 이는 상용 애플리케이션 솔루션 모델에도 도입되고 있다고 덧붙였다.

그가 말한 '빅데이터 저장소'는 하둡 자체가 아니라 기술 구성요소인 하둡분산파일시스템(HDFS)을 가리키는 듯하다. HDFS는 하둡을 설치한 여러 서버에 대용량 파일을 나눠 보관할 수 있는 체계다. 이는 SNS, M2M센서, 웹로그 등을 저장하는데 흔히 쓰인다.

하둡이 상용 솔루션에 도입되고 있다는 표현은 고가 분석장비 공급업체인 EMC, 오라클, IBM, 테라데이타, HP, SAP 등이 내놓은 '하둡커넥터'를 염두에 둔 것으로 보인다. 하둡커넥터는 HDFS에 저장된 데이터를 별도의 저장공간으로 불러오는 기술이다. 실시간 동기화나 양방향성을 보장하지 않기에 활용이 제한적이다.

고가 분석장비 업체들은 분석에 특화된 고성능 하드웨어(HW)와 상용화된 분석SW를 결합해 데이터웨어하우스(DW) 또는 어플라이언스라 불리는 제품을 팔아 왔다. 여기서 커넥터로 연결된 하둡의 역할은 HDFS에 외부 데이터를 저장해 뒀다가 DW가 분석업무를 수행시 요청한 자료를 찾아 넣어주는 들러리로 전락한다.

여전히 그레고어 CEO가 예고한 하둡 관리 방안이 이처럼 기존 상용 솔루션 업체들의 DW에 연결된 하둡을 다루는 방식일 것인지는 불분명하다. 그렇다면 일반 DW나 관계형 데이터베이스(DB) 관리업체들의 활동 범주와 크게 다르지 않아 회사가 목청껏 부르짖어온 '혁신'에 해당하는 사례로 자랑하기 어려워진다.

앞서 그레고어 CEO는 CA는 메인프레임 및 분산 환경에서부터 가상화, 클라우드까지 모든 IT 환경을 관리하고 보호하는 솔루션을 제공해 기업 및 기관들이 IT 운영을 보다 효율적으로 할 수 있도록 해왔다고 주장했다.

그래서 어쩌면 하둡 프레임워크를 통해 운영되는 전체 데이터 인프라를 관리하겠다는 의미일 가능성도 제기된다. HDFS 환경의 성능을 관리하고, 서버클러스터의 수준별 고장여부나 이상징후를 파악하거나, 외부 접근을 감시해 차단하고, 조직의 계정관리시스템과 연계해 저장 데이터의 보안을 높일 계획일 수도 있다.

다만 냉정히 볼 때 그에 대한 업계 기대치는 높지 않다. 상용화된 이기종 기술을 통합 관리하는 것보다 여러 오픈소스 기술을 통합관리하는 게 좀 더 어려울 수 있어서다. 아직 하둡은 일괄 관리하기엔 미성숙한 기술이고 타 배포판뿐 아니라 버전간의 차이도 큰 상황이다.

이는 아직 자체적으로 설치형 하둡 배포판을 개발중인 전문업체들도 진지하게 도전하고 있는 영역이다. 해외서 클라우데라나 호튼웍스, 국내서 그루터나 넥스알 등이 하둡 환경의 구성요소에 대한 모니터링 기술을 각각 개발중이다. CA의 장기인 이기종 플랫폼 관리 전략을 하둡 환경에도 가져갈 수 있을 것인지 지켜볼 만하다.

관련기사

이날 그레고어 CEO는 빅데이터나 클라우드컴퓨팅 시장 흐름에 관련해 오픈소스 분야에 어떤 투자를 기울일 것이냐는 질문에 (오픈소스 기술개발 업체는 아니지만) 현재도 소스코드 기여 활동이 활발하며 고객사들이 거대한 오픈소스 사용자 커뮤니티를 형성했다고 강조했다.

또 그는 CA는 우수한 기술과 제품을 보유한 기업을 적절히 인수해 고객요구에 발빠르게 대응중이라며 인도와 실리콘밸리 등에 좋은 회사가 있고, 이와 별개로 세계 곳곳에 있을 좋은 회사들을 계속 찾고 있다고 덧붙였다.