한국 빅데이터를 위한 이정표를 세워라

일반입력 :2013/04/08 09:43    수정: 2013/04/12 14:03

빅데이터 시장의 거품과 안개를 걷어내고 정확한 시각을 추구하려는 움직임이 강조되는 분위기다. 일정 규모 이상 되는 조직들은 모두 빅데이터 대응이 시급하다는 점에 긍정하고 있다. 그간 흘려보내거나 무시해온 데이터로부터 눈앞의 경쟁 상황과 장기적인 '전쟁'에 대비하기 위함이다.

이에 지디넷코리아는 오는 17일 서울 잠실롯데호텔에서 'Big Data: Value & Hidden Insight’란 주제로 '제9회 어드밴스드컴퓨팅컨퍼런스(ACC)'를 개최한다. 행사 참가를 원하는 경우, 공식 웹사이트(http://acc.zdnet.co.kr/register.html)를 통해 등록하면 된다(문의:070-7714-5050, 이메일:event@zdnet.co.kr).

행사는 국내외 빅데이터 전문가를 초청해 최신 기술과 비즈니스에 최적화된 구현방법, 기술적 이슈 등 빅데이터 관련 정보가 종합적으로 소개하는 자리다. 국내 기업들이 빅데이터 대응전략을 올바른 방향으로 세울 수 있도록 이정표를 제시할 것으로 기대된다.

■플랫폼, 분석업체와 하둡 전문업체 총출동

오전 기조연설에는 아마존웹서비스(AWS)가 빅데이터와 고성능컴퓨팅(HPC)를 주제로 발표하며, KT클라우드웨어의 한재선 최고기술책임자(CTO)가 빅데이터의 올바른 이해와 대응전략을 소개한다.

퀀텀, 오라클 등의 기조연설 이후 오후 행사는 ▲빅데이터 중심 비즈니스 ▲빅데이터 및 엔터프라이즈 IT ▲빅데이터 및 기술 트렌드 ▲빅데이터 튜토리얼 등 4분야로 나뉘어 세션이 마련된다.

트랙1에는 마이크로스트레티지, LG CNS, 스플렁크 등이 발표하며, 줌인터넷의 김우승 연구소장이 빅데이터 활용 사례를 공개한다.

트랙2에는 HP, 델, 테라데이타, 오라클 등 솔루션업체가 밝히는 빅데이터 인프라 확보 방안이 소개된다.

트랙3에는 빅데이터 활용을 위한 SAS의 전략과 HP의 하둡 서비스, 빅데이터 플랫폼의 미래로서 데이터스택스의 카산드라가 소개된다.

또한 아파치 하둡의 주요 프로젝트인 '타조'를 설명하는 자리도 마련된다. 타조는 '인터랙티브 쿼리 포 하둡' 즉, 하둡 상에서 실시간 SQL 쿼리 분석을 할 수 있도록 하는 오픈소스 기술로, 그루터 소속 개발자와 고려대학교 연구진이 커미터로 참여해 개발하고 있다.

트랙4에는 김병곤 클라우다인 대표이사의 아파치 피그, 하이브, 스쿱을 이용한 데이터 처리 실습과, R을 사용한 데이터 분석 프로세스 및 마이닝 실습이 마련됐다.

행사를 마감하는 마지막 기조연설엔 하둡 분야의 저명업체 클라우데라가 하둡 보안과 임팔 활용 전략을 소개한다. 임팔라도 하둡 상에서 실시간 SQL 쿼리 분석을 할 수 있도록 하는 클라우데라의 기술이다.

■빅데이터가 뭐길래

빅데이터는 구글과 야후같은 인터넷서비스업체들이 그들의 사업 기반을 존속시키기 위해 기술적으로 기존 방식과 다른 접근을 추구하면서 비롯됐다. 데이터에 대한 새로운 관점을 취하고 그 다음 새로운 방법론을 연구했다. 이를 뒷받침할 기술 도입과 적용은 장기간에 걸쳐 병행됐다.

새로운 접근법, 패러다임의 전환은 많은 변화를 요구한다. 이미 굳어버린 습관과 선입견, 고정된 조직체계, 경직된 문화, 그리고 폐쇄적인 기술은 빅데이터 활용을 가로막는 주범이다. 그리고 빅데이터에 혼란을 느끼게 되는 이유기도 하다.

빅데이터는 데이터를 소유한 사람의 자세가 변해야만 비로소 가능성을 보여준다. 태도를 바꾸고 여러 실패를 발판삼아 돌파하면 ‘고객도 모르는 미래의 행동’을 제법 정확하게 예측해낼 수 있게 해준다.

국내외 시장조사전문업체들은 올해 10대 IT 이슈 중 ‘빅데이터의 도입과 활용’을 1순위로 꼽았다. 지난해까지 검토단계였던 빅데이터가 올해부터 본격적인 활용단계로 이어질 것이란 전망도 나왔다. 일각에서는 빅데이터가 마케팅 용어에 불과하며 기존 고객관계관리(CRM)를 재포장한 것에 불과하다는 반박도 있다.

하지만 외국서 빅데이터에는 선도업체들의 데이터에 대한 새로운 관점과 철저한 실험정신이 녹아 있는 개념으로 다가온다. 국내서 일부 기업이 이를 서둘러 적용하겠다, 도입하겠다며 명확한 해법을 갖고 있다는 사업자를 찾아 단기 구축 프로젝트를 추진하는 흐름과는 사뭇 다른 분위기다.

데이터에 대한 새로운 패러다임을 바로 볼 필요가 있다. 이는 처리할 데이터의 상대적으로 부담스러운 크기, 데이터의 다양한 유형, 데이터의 증가속도가 앞서 존재했던 처리기술만으로는 충분한 투자비용 대비 처리효율을 보일 수 없는 경우에 다른 관점을 취해야 한다는 얘기다.

관련기사

새로운 걸 찾아내려면 지속적으로 시도할 수 있는 끈기와 환경이 필요하다. 또, 다양한 방법을 동원할 수 있는 개방적인 플랫폼이 있어야 한다. 투자대비수익(ROI) 측면과 개방성 때문에 빅데이터의 표준처럼 자리잡은 게 ’하둡‘이다.

일반적인 IT 프로젝트는 특정 목적을 향해 추진된다. 사업명에 나오듯 XXX시스템 구축 등의 형식이다. 이 목표는 프로젝트가 완료되면 그 자체가 성과다. 반면, 빅데이터는 시스템 구축이 끝이 아니다. 시스템 마련은 단지 진정한 프로젝트를 시도하기 위한 준비과정에 불과하다.