네이버 파파고, 한-중 번역 더 자연스러워졌다

인공신경망 방식 첫 적용…구글 등은 통계기반 번역 사용

인터넷입력 :2016/12/15 14:20    수정: 2016/12/15 14:50

손경호 기자

네이버의 모바일 번역앱 파파고의 중국어 실력이 몰라보게 좋아졌다.

특히 사상 처음으로 한중 번역에 인공신경망 번역(NMT) 기술을 적용한 점이 눈에 띈다. 덕분에 전체적인 문맥을 파악하고, 새로운 문법 규칙에 따라 재배열할 수 있게 돼 경쟁 서비스보다 훨씬 자연스러운 번역이 가능해졌다고 네이버 측이 강조했다.

15일 네이버의 차세대 기술연구조직 네이버랩스가 개발한 파파고는 지난 10월 한국어-영어에 이어 한국어-중국어 번역에도 NMT 기술을 적용했다고 밝혔다.

네이버랩스에 따르면 기존 구글, 바이두 등이 활용하고 있는 통계기반 번역(SMT)은 단어와 몇 개 단어가 모인 구(Phrase) 단위로 쪼개 번역했다. 이와 달리 인공신경망 번역은 문장을 통째로 번역하는 식이다. 빅데이터 분석, 머신러닝 등 기술을 활용해 전체 문맥을 파악한 뒤 문장 안에서 단어와 순서, 의미, 문맥에서의 의미 차이 등을 반영해 스스로 인간이 구사하는 언어와 유사하게 문장 전체 맥락을 이해해 상황에 맞게 번역해준다는 설명이다.

네이버 관계자는 "구글이나 바이두 등도 인공신경망 번역을 도입하고는 있지만 한국어-중국어에 이러한 기술을 적용한 것은 네이버가 먼저"라고 말했다.

예를 들어 '난 밤마다 밤을 먹는다'란 문장을 중국어로 번역한다고 가정해보자.

구글, 바이두 등에 적용된 통계기반 번역에선 '밤'이란 여러 동음이의어 중 어떤 의미를 선택해야 할 지 잘 구분되지 않는다. 시간이 지나 어두워진 상황을 의미하는 '夜'로 번역할지 밤나무의 나무 열매를 뜻하는 '栗子'로 번역할지 판단하기 어렵다.

중국어를 한국어로 번역하는 경우에도 NMT 기술을 활용하면 통계기반 방식에 비해 결과가 자연스럽고 부드러워진다.

네이버랩스는 인공신경망 번역과 통계기반 번역을 비교해 보는 자체 테스트 결과 한국어를 중국어로 번역하는 경우 인공신경망 번역이 통계기반에 비해 약 160%, 중국어에서 한국어로 번역은 약233%까지 번역 정확도가 개선됐다고 설명했다.

관련기사

네이버 관계자에 따르면 평가는 언어학자에게 인공신경망, 통계기반 번역을 한 문장을 제시한 다음 어느 것이 더 자연스럽게 번역이 이뤄졌는지를 평가해 점수를 매기도록 했다. 그 결과 통계기반 대비 파파고에 적용된 인공신경망 번역의 점수가 이 정도 수준으로 차이가 났다는 설명이다.

파파고는 한국어, 영어, 중국어(간체), 일본어 이외에 내년에는 스페인어, 프랑스어, 인도네시아어, 태국어, 중국어(번체), 베트남어 등 6개 언어 번역을 추가하면서 인공신경망 번역 기술을 확대 적용해 나갈 계획이다.