머신러닝, 빅데이터와 뭐가 다르지?

컴퓨팅입력 :2015/11/11 16:16

황치규 기자

머신러닝은 인공 지능의 한 분야로 컴퓨터가 데이터를 통해 학습하고 사람처럼 어떤 대상 혹은 상황을 이해할 수 있게 하는 기술이다. 스스로 학습할 수 있는 컴퓨터가 사용자를 이해한다면 이전에 할 수 없었던 방식의 서비스가 가능해진다는게 업계 설명이다. 머신러닝은 컴퓨터가 데이터를 분석할 수 있게 하는 알고리즘을 짜는 것이 핵심이다. 데이터를 활용하는 알고리즘을 정교하게 만들면 컴퓨터가 스스로 학습해가며 사용자들에게 의미있는 결과물을 제공할 수 있다는 것이다.

머신러닝에 잘 붙어다니는 말 중 하나가 바로 빅데이터다. 머신러닝과 빅데이터 모두 데이터 분석이란 의미가 버무려져 있어, 얼핏 비슷한 의미로도 들린다. 그러나 빅데이터와 머신러닝은 연관성은 있지만 각자의 길을 걷는 기술이다. 빅데이터는 대규모 데이터를 처리하는 기술이고, 머신러닝은 빅데이터를 잘 활용할 수 있는 분야 중 하나로 보면 된다. 데이터를 이용하기 위해선 모델링이 필요한데, 이걸 사람이 아니라 컴퓨터가 알아서 하게 하는 것이 머신러닝이다.

컴퓨터가 학습을 하고 데이터에서 스스로 패턴을 찾아낸다고 하니 인공지능과 머신러닝이 같은 기술인지도 헷갈린다. 결론부터 말하면 머신러닝은 인공지능의 한 부분이다. 한국MS 관계자는 "인공지능은 워낙 광범위한 범위를 포함하고 있고 그 중 머신러닝은 예측에 대한 부분을 주로 맡는다"고 설명했다.

머신러닝 기술이 적용된 사례. (시계방향)넷플릭스 영화추천, 마이크로소프트 음성비서 코타나, 아마존 홈 IoT 디바이스 에코, 구글 셀프드라브카

그는 또 "기존 IT 시스템은 학습이란 과정이 배제돼 있었다. 정확한 길을 만들어 주고 따라가게만 했다면 머신러닝은 뭔가 잘못 된 부분이 있으면 다음엔 그러지 말라고 하는 학습과정이 있다. 이렇게 시스템 이 계속 발전하는 건데 사람이 교정해 주는 것이 아니라 시스템이 갈수록 스스로 발전하는 것이 머신러닝”이라고 덧붙였다.

머신러닝도 어려운데, 요즘에는 딥러닝이라는 말까지 등장했다. 역시나 머신러닝과 딥러닝이 같은건지 다른 것이 헷갈리기 시작한다. 네이버랩스 김정희 수석연구원은 ” 딥러닝은 머신러닝의 방법 중 하나로 아주 복잡한 모델링까지 가능하면서 인기를 끌고 있다” 며 "딥러닝은 컴퓨터 공학자들이 사람 뇌가 어떻게 작동하고 있나를 단순하게 모델링한 것이다”고 말했다.

관련기사

머신러닝이라는 말때문에, 분석에 사람은 필요 없을 것 같은 생각도 든다. 그러나 머신러닝에서 데이터사이언티스트의 역할은 절대적이란게 대다수 전문가들의 견해다. 데이터, 그리고 수요에 맞는 데이터를 명확히 이해하는 인력을 갖추지 못하면, 머신러닝을 제대로 활용하기는 어렵다는 지적이다.

빅데이터 플랫폼 업체 피보탈의 그레그 월렌 디렉터는 헬스케어 분야를 예로 들며 "데이터사이언티스트는 환자가 추가적인 치료가 필요할 경우 언제 해야 하는지, 어떻게 해야 하는지 예측하고 이를 애플리케이션에서 활용할 수 있는 기능으로 제공하는 일을 한다"고 말했다.