"AI 모델 구축보다 데이터 중요"

ACC+ 이재훈 메가존 상무 주제강연

컴퓨팅입력 :2018/08/28 17:37

"어떤 비즈니스 문제를 해결하기 위한 모델을 만들기 전, 로 데이터를 충분히 분석하고 파악하는 것이 중요하다. 데이터는 품질뿐만 아니라 볼륨(양)도 중요하다."

이재훈 메가존 상무는 28일 서울 중구 서울신라호텔에서 지디넷코리아가 개최한 제15회 어드밴스드컴퓨팅컨퍼런스플러스(ACC+)에서 이같이 말하며 데이터의 중요성을 강조했다.

이 상무는 '인공지능(AI) 프로젝트 성공하기'라는 주제로 발표하며 AI 프로젝트 진행 시 고려해야 할 사항들에 대해 말했다.

메가존 이재훈 상무

먼저 이 상무는 비즈니스 문제를 해결하기 위해 AI 모델을 만들 때, 모델 구축 보다는 지속적이며 생산적인 데이터를 확보하는게 중요하다고 말했다. 단순 숫자가 아닌 이미지나 보이스, 텍스트 등 비정형적인 데이터를 사용해 딥러닝으로 결과값을 내는 것이 결코 쉬운 일이 아니기 때문이다.

이 상무는 공사장에서 안전모를 착용하도록 알람을 주는 기능을 만들기 위해 구축한 AI 모델을 예를 들어 설명했다.

예전엔 안전모에 센서를 부착해 해당 안전모를 소유한 근로자가 안전모를 썼는지 안썼는지 확인을 하는 방법이 있었지만, 제대로 지켜지지 않거나 비용이 많이 드는 단점이 있었다.

이 상무는 AI를 이용해서 웹캠이 안전모 착용 여부를 구분하게 하도록 했다. 해당 카메라가 안전모를 인식할 수 있도록 구글의 이미지를 다운 받아 학습시켰지만, 이미지의 품질이나 양이 적어 잘못 인식하는 경우도 있었다.

이 상무는 "모델은 잘못이 없다"며 "데이터가 부족해서 일어나는 일"이라고 말했다.

회사 측은 안전모를 하나 구입해 360도로 각 부분마다 정교하게 사진을 찍어 데이터를 확보했다. 분석할 데이터 양을 6배로 늘린 결과, 정확도가 95%가 됐다.

이 상무는 또 하나의 사례로 자율자동차를 위한 AI 모델 구축에 대해 언급했다.

이 상무는 도로에서 신호등의 변화에 따라 반응하는 자율자동차를 만들기 위한 AI 모델을 해외에서 갖고온 적이 있는데, 이 모델에 학습돼 있는 데이터에 문제가 있었다.

이 모델을 만든 국가의 신호등이 세로였던 것. 우리나라의 가로 신호등과는 맞지 않았던 것이 문제였다.

관련기사

이 상무는 "다시 우리나라 신호등을 인식하도록 만들기 위해 가로형 신호등 사진을 찍어 직접 라벨링해 데이터 양을 늘려 학습시켰다"며 "다른 사람이 만들어 놓은 모델을 이용한다면, 학습된 데이터에 대해 파악하는 것도 중요하다"고 말했다.

이 상무는 "AI는 프로그래밍이 아닌 데이터 디버깅"이라며 "데이터가 많을수록 모델을 꾸준히 튜닝 해야 하며, 특히 갱신 되는 데이터가 많을수록 자주 학습 시켜야 한다"고 강조했다.