'열풍' 빅데이터의 뜬 구름을 걷어내라

일반입력 :2013/03/28 08:49    수정: 2013/04/02 09:25

한국 빅데이터가 새로운 전기를 맞고 있다. 말 그대로 열풍이다. 기업이고 공공기관이고, 너나할 것 없이 빅데이터를 외쳐댄다. 더미 속에 묻혔던 데이터에서 미래의 경쟁력을 찾아내기 위해 혈안이다.

국내외 시장조사전문업체들은 올해 10대 IT 이슈 중 ‘빅데이터의 도입과 활용’을 1순위로 꼽았다. 지난해까지 검토단계였던 빅데이터가 올해부터 본격적인 활용단계로 이어질 것이란 전망도 나왔다.

현실은 녹록지 않다. 각 기업은 빅데이터에 대한 정보와 이해 부족으로 사업에 적용하긴 커녕 시도조차 주저한다. 이에 빅데이터가 과거의 CRM과 다를 게 없다는 반론도 흘러나온다. 전과 다를 게 없다고 단순한 ‘버즈워드’로 폄훼하는 목소리도 만만치 않다. 빅데이터에 대한 가장 큰 오해다.

■빅데이터가 혼란스러운 이유

데이터는 과거에도 오늘도 있었다. 사람이 컴퓨터란 것을 만든 태초부터 데이터는 쌓였다. 그동안 해왔듯 표본 속에서 찾아내는 가치와, 전수조사에서 찾아내는 가치가 같을 수 없다. 빅데이터는 표본조사와 전수조사의 작업시간과 비용이 엇비슷해지며 가능해졌다.

빅데이터를 처음 활용하겠다고 생각했던 사람은 익히 알려진 IT솔루션업체가 아니었다. 구글, 야후, 아마존 같은 인터넷 서비스업체들이 빅데이터를 한발 앞서 다루기 시작했다. 이들은 IT를 생명줄로 삼아온 서비스업체들이다.

인터넷 서비스 회사들은 빅데이터란 말이 유행하기 이전부터 데이터에 새롭게 접근하는 과정에서, 직접 기술을 개발하고 방법론을 만들었다. 절실한 생존 욕구를 해결해줄 방책을 마련하기 위해 스스로의 경쟁력을 만들어내 성공한 회사들이다.

빅데이터는 선도적인 서비스업체들의 데이터에 대한 새로운 시각과 도전정신이 수많은 시행착오와 축적된 경험과 결합돼 빛을 발했다.

특정 기술을 빅데이터로 축소시키는 건 불가능하다, 빅데이터는 데이터에 대한 새로운 패러다임이다. 데이터의 양(Volume), 데이터 생성 속도(Velocity), 형태의 다양성(Variety), 가치(Value) 등을 가리키는 4V는 중요치 않다. 아주 작은 데이터라도 새로운 시각으로 접근한다면, 그게 빅데이터다.

새로운 걸 찾아내려면 지속적으로 시도할 수 있는 끈기와 환경이 필요하다. 또, 다양한 방법을 동원할 수 있는 개방적인 플랫폼이 있어야 한다. 투자대비수익(ROI) 측면과 개방성 때문에 빅데이터의 표준처럼 자리잡은 게 ’하둡‘이다.

일반적인 IT 프로젝트는 특정 목적을 향해 추진된다. 사업명에 나오듯 XXX시스템 구축 등의 형식이다. 이 목표는 프로젝트가 완료되면 그 자체가 성과다. 반면, 빅데이터는 시스템 구축이 끝이 아니다. 시스템 마련은 단지 진정한 프로젝트를 시도하기 위한 준비과정에 불과하다.

■고객도 몰랐던 것을 미리 발견하려면

새로운 접근법, 패러다임의 전환은 많은 변화를 요구한다. 이미 굳어버린 습관과 선입견, 고정된 조직체계, 경직된 문화, 그리고 폐쇄적인 기술은 빅데이터 활용을 가로막는 주범이다. 그리고 빅데이터에 혼란을 느끼게 되는 이유기도 하다.

빅데이터는 데이터를 소유한 사람의 자세가 변해야만 비로소 가능성을 보여준다. 태도를 바꾸고 여러 실패를 발판삼아 돌파하면 ‘고객도 모르는 미래의 행동’을 제법 정확하게 예측해낼 수 있게 해준다.

과거 스티브 잡스는 “고객은 자기가 원하는 것을 알지 못한다”고 말했다. 고객을 깜짝 놀라게 할 서비스나 필요로 할 상품을 기업이 먼저 찾아야 한다는 지적이었다.

이에 지디넷코리아는 다음달 17일 서울 잠실롯데호텔에서 'Big Data: Value & Hidden Insight’란 주제로 '제9회 어드밴스드컴퓨팅컨퍼런스(ACC)'를 개최한다. 국내외 빅데이터 전문가를 초청해 최신 기술과 비즈니스에 최적화된 구현방법, 기술적 이슈 등 빅데이터 관련 정보가 종합적으로 소개될 예정이다.

오전 기조연설에는 아마존웹서비스(AWS)가 빅데이터와 고성능컴퓨팅(HPC)를 주제로 발표하며, KT클라우드웨어의 한재선 최고기술책임자(CTO)가 빅데이터의 올바른 이해와 대응전략을 소개한다.

퀀텀, 오라클 등의 기조연설 이후 오후 행사는 ▲빅데이터 중심 비즈니스 ▲빅데이터 및 엔터프라이즈 IT ▲빅데이터 및 기술 트렌드 ▲빅데이터 튜토리얼 등 4분야로 나뉘어 세션이 마련된다.

트랙1에는 마이크로스트레티지, LG CNS, 스플렁크 등이 발표하며, 줌인터넷의 김우승 연구소장이 빅데이터 활용 사례를 공개한다.

트랙2에는 HP, 델, 테라데이타, 오라클 등 솔루션업체가 밝히는 빅데이터 인프라 확보 방안이 소개된다.

트랙3에는 빅데이터 활용을 위한 SAS의 전략과 HP의 하둡 서비스, 빅데이터 플랫폼의 미래로서 데이터스택스의 카산드라가 소개된다.

또한 아파치 하둡의 주요 프로젝트인 '타조'를 설명하는 자리도 마련된다. 타조는 '인터랙티브 쿼리 포 하둡' 즉, 하둡 상에서 실시간 SQL 쿼리 분석을 할 수 있도록 하는 오픈소스 기술로, 그루터 소속 개발자와 고려대학교 연구진이 커미터로 참여해 개발하고 있다.

트랙4에는 김병곤 클라우다인 대표이사의 아파치 피그, 하이브, 스쿱을 이용한 데이터 처리 실습과, R을 사용한 데이터 분석 프로세스 및 마이닝 실습이 마련됐다.

관련기사

행사를 마감하는 마지막 기조연설엔 하둡 분야의 저명업체 클라우데라가 하둡 보안과 임팔 활용 전략을 소개한다. 임팔라도 하둡 상에서 실시간 SQL 쿼리 분석을 할 수 있도록 하는 클라우데라의 기술이다.

행사 참가를 원하는 경우, 공식 웹사이트(http://acc.zdnet.co.kr/register.html)를 통해 등록하면 된다(문의:070-7714-5050, 이메일:event@zdnet.co.kr).