시스트란, 인공지능 고전문헌 자동번역시스템 구축

번역저변 고전문헌 현대어 변환으로 확대

컴퓨팅입력 :2018/01/22 14:00

시스트란인터내셔널(대표 지 루카스)은 한국고전번역원 '인공지능(AI) 기반 고전문헌 자동번역시스템 구축' 프로젝트 수행을 마쳤다고 22일 밝혔다.

고전문헌 자동번역시스템 구축 프로젝트는 지난해 6월부터 6개월간 진행된 과학기술정보통신부 한국정보화진흥원 '2017년도 ICT기반 공공서비스 촉진사업' 과제였다. 시스템은 2가지 말뭉치를 활용한 AI 자동번역 모델 훈련을 거쳤다. 하나는 고전번역원에서 제공한 승정원일기 영조대 즉위년부터 4년 3월까지의 말뭉치 35만건, 다른 하나는 시스트란사 자체보유 말뭉치였다. 자동번역 모델 훈련은 30회 이상 진행됐다.

시스트란인터내셔널 로고

시스템에는 신경망기계번역(NMT) 기술이 적용됐다. 원문과 번역문에서 연관성이 있는 패턴을 찾아내고 이 데이터를 기반으로 번역모델을 생성하는 방식이었다. 번역모델은 원문과 번역문간 대응관계 정보를 스스로 학습해, 실제 번역 과정에서 적합한 대역어 관계를 판단하고 최종 번역문을 만들어낸다는 게 시스트란인터내셔널 측 설명이다.

시스트란인터내셔널은 고전 한자를 의미단위로 분리해주는 고전문헌용 토크나이저를 별도 개발해 번역시스템에 통합했다. 토크나이저는 번역엔진의 고전문헌 인식을 돕는 역할을 한다. 회사측은 연내 시스템에 고전문헌 말뭉치를 추가하고 번역문의 기계학습 길이를 300자까지 확장할 예정이다. 초벌 번역 작업에 긴 고전문헌 문장도 처리되게 하겠다는 설명이다.

관련기사

시스트란인터내셔널은 향후 한국고전종합DB에서 서비스되고 있는 조선왕조실록, 일성록 및 문집류 원문과 번역문 DB를 대상으로 한 고전문헌 자동번역 모델 확대 등 고도화 사업을 진행할 계획이다. 고전문헌 번역자의 초벌번역작업을 돕고 향후 유관기관과 관련학과 업무, 연구과정에 쓸 수 있는 자동번역 서비스를 내놓을 예정이다.

지 루카스 시스트란인터내셔널 대표는 "세계 1위 지능형 언어처리 기업으로써 역사 연구를 비롯한 다양한 연구 분야 발전을 위해 지속적으로 노력하며 비즈니스 역량을 강화하겠다"고 말했다.