[NDC18]딥러닝 기술로 게임 내 욕설 탐지하기

인공지능(AI) 기술 개발 및 적용을 전담하는 넥슨코리아의 인텔리전스랩스 소속 조용래 연구원이 24일 ‘딥러닝으로 욕설 탐지하기’를 주제로 NDC2018에서 강연을 했다. 주된 강연 내용은 딥러닝 기반의 욕설 탐지기를 개발하며 겪은 시행착오와 성과 공유였다.

조용래 연구원은 이날 판교 GBI타워 지하 1층에 마련된 NDC2018 강연장에서 “욕설은 게임 내 가장 큰 불쾌요소 중 하나다”라고 말했다.

이어 “욕설 탐지에 딥러닝 기술 도입을 생각했던 이유는 기존 금칙어 기반 제재 시스템에 한계와 문제점이 있었기 때문”이라고 덧붙였다.

넥슨코리아 인텔리전스랩스 소속 조용래 연구원이 24일 ‘딥러닝으로 욕설 탐지하기’를 주제로 NDC2018 강연을 했다.

조 연구원에 따르면 금칙어 제재에는 세 가지 문제점이 있었다. 단어 조합 등으로 우회적인 욕설을 할 수 있고, 오탐이 잦다. 또한 비속어 표현을 구분하는데 한계가 있었다. 예를들어 18채널을 욕설로 인식해 **채널로 변환하는 식이다.

이러한 이유로 대부분의 게임사가 활용하고 있는 금칙어 제재는 욕설 신고를 받은 운영자가 직접 확인해 최종 제재할 수 밖에 없었다.

조 연구원은 “딥러닝을 활용한 욕설 탐지 기술 개발은 운영자들의 수고를 더는 것을 목표로 출발했다”라며 “금칙어 기반의 경우 이를 확인해야하는 시간과 운영자의 스트레스가 크다”고 했다.

그렇다면 딥러닝 기반 욕설 탐지 기술은 어떤 과정으로 탄생했을까. 크게 데이터 확보, 모델링, 해석 등으로 나뉜다. 이 과정은 중첩돼 다시 진행된다.

데이터는 라벨링을 뜻한다. ‘안녕하세요. 즐겜하세요’는 정상, ‘게임 ㅈ같이 하네’는 욕설이란 태그를 다는 행위다. 이러한 데이터 확보는 기본적으로 노동력이 필요하다.

모델링은 기본적으로 CNN을 사용했다. CNN은 이미지 처리분야에서 일반적으로 사용되는 알고리즘이다. 필터를 만들어 특성을 추출해 데이터를 학습하는 과정이다.

욕설 구분은 자음과 모음에 이어 텍스트를 숫자로 변환했다. 채팅할 때 띄어쓰기도 안하고 오타도 많아서다. 여기에 숫자로 변환하면 비슷한 욕일 경우 탐지하기 쉽게 일반화를 하기 위해서였다.

이러한 과정에서 탄생한 욕설 탐지 기술은 넥슨이 서비스하고 있는 일인칭슈팅(FPS) 게임 서든어택에 프로토타입으로 적용했으며, 테스트 결과 기존 금칙어 기반과 비교해 모니터링 건수와 정확도가 높았다.

그렇다고 딥러닝 욕설 탐지 기술이 사람을 완벽히 대체할 수 있는 만능은 아니라고 했다. 1건이라도 무고한 사람을 제재하면 안되기 때문이다.

조 연구원은 “욕설 탐지 기술을 테스트한 결과 1분간 35건을 찾아냈다. 같은 조건으로 금칙어는 23건을 찾아냈다. 제재대상 비율로 보면 기존 기술은 41%, 욕설 탐지 기술은 96% 정확도를 보였다”고 했다.

그러나 그는 “인공지능은 (터미네이터의)스카이넷이 아니라 (아이언맨의)자비스라고 생각한다. 사람을 대체하는 게 아닌 인간을 편리하게 하고 업무를 효율적으로 활용하는 것”이라며 “인공지능이 일을 잘하기 위해선 게임 개발과 운영, 데이터 분석 등의 전문가들이 협업하는 게 중요해 보인다”고 했다.