네이버 클로바는 어떻게 AI 최상급 학회 눌렀나

세일즈포스 WikiSQL 대회서 최고점…"긴호흡 연구환경 도움"

인터넷입력 :2019/02/08 08:07    수정: 2019/02/08 11:44

모든 사물이 인터넷으로 연결되고, 터치를 넘어 음성으로 명령을 내리고 답을 얻는 시대가 되면서 이와 관련된 인공지능(AI) 기술이 더욱 중요해지고 있다.

사람의 말을 바로 알아듣고 맥락을 이해하는 기술은 기본, 방대하게 축적된 데이터와 이 속에서 답을 빠르게 찾아 제시하는 기술 또한 기업 경쟁력이 되고 있다. 특히 2019년 전세계 AI스피커 출하량이 1억여대에 달할 것이란 전망이 나오면서 관련 기술과 시장에 대한 정보통신기술 기업들의 투자와 연구개발 경쟁이 더욱 뜨거워지는 분위기다.

이 가운데 최근 글로벌 클라우드 컴퓨터 솔루션 기업인 세일즈포스가 구축한 데이터베이스(DB)를 기반으로, 자연어 질문을 컴퓨터 DB가 잘 알아들을 수 있는 언어(SQL)로 바꾸고 정확한 답을 찾는 대회에서 네이버 클로바 연구개발조직이 가장 높은 점수를 획득해 주목을 받았다.

네이버 서치앤클로바 CIC 클로바 AI 랭귀지 파싱(Language Parsing) TF 소속의 황원석 연구원(왼쪽), 서민준 PM

클로바 팀은 해당 대회(WikiSQL)에서 아마존, 마이크로소프트 등과 같은 글로벌 리딩 기업들보다 높은 정확도를 기록해 개발자들 사이에서 화제가 됐다. 네이버 클로바 팀의 모델(SQLova)은 약 90% 정확도로 질문에 대한 정답을 찾아냈다. 쉽게 말해 네이버 클로바 기술이 사람의 말을 컴퓨터가 이해하는 언어로 가장 잘 바꿔, 질문에 대한 정확한 답을 잘 찾아냈다는 뜻이다.

이 팀을 이끈 주인공이 바로 네이버 서치앤클로바 CIC 클로바 AI 랭귀지 파싱(Language Parsing) TF 소속의 황원석 연구원, 서민준 PM이다. 지디넷코리아는 최근 분당에 위치한 네이버를 찾아 두 개발자를 만나 인터뷰를 진행했다.

황원석 연구원은 물리학 전공자로, 지난해 3월 네이버 클로바 연구원으로 합류했다. 컴퓨터 공학 분야에 대한 경험이 없었음에도 딥러닝의 이론적 토대를 제공하는 물리학에 대한 높은 이해를 바탕으로 이번 연구에 많은 기여를 했다.

서민준 PM은 구글 등에서 근무하며 쌓은 글로벌 자연어(NLP) 처리 분야 노하우를 기반으로 이번 프로젝트에서 전체 방향을 세우는 매니저 역할을 했다.

WikiSQL 프로젝트 현 순위 표

먼저 서민준 PM에 따르면 세일즈포스가 주도한 이번 대회는 표 형태로 정리된 정형화 데이터에서 질문에 대한 답을 찾는 방식이었다. 글로벌 기업과 AI 최상급 학회에서 참여했다는 점에서 높은 권위를 자랑하는 대회였다.

예를 들어 한국 프로야구 팀별 전적과 선수별 성적이 정리된 데이터가 표 형태로 정리돼 있다고 가정하면, “이대호보다 더 많은 홈런을 친 타자는?”, “잠실 구장에서 가장 타율이 높은 타자는?”과 같은 질문에 대한 답을 누가 가장 정확히 찾는 대회다.

서민준 PM은 “이번 대회에서 클로바 팀이 사용한 모델이 받은 점수인 약 90% 정확도는 거의 최고점이다. 사실상 대회 자체를 종결시킨 셈”이라고 설명했다.

좋은 기술을 훌륭한 인재들이 모여 개발하고, 이 성과가 이름 난 대회에서 우승을 차지하거나 인정을 받는다고 해서 모두 좋은 결과로 이어지는 건 아니다. 권위있는 학술지에 실리고 그 가치를 인정받는다 해도 실생활에 쓰이지 않거나, 기업에게 이윤을 가져다 주지 않는 경우가 허다하기 때문이다. 그야말로 연구를 위한 연구에 그치는 경우가 적지않다.

이런 맥락에서 볼 때 황원석 연구원, 서민준 PM이 이번에 거둔 성과는 AI 등 기술 개발에 주력하는 네이버로서 값진 의미를 지닌다. 특히 AI 스피커, 자율주행차, 로봇 기술 등에 네이버가 많은 힘을 쏟는 만큼, 사람과 컴퓨터의 원활한 의사소통에 큰 도움을 줄 것으로 기대된다. 일례로 네이버 클로바 AI 스피커 사용자라면 보다 세밀한 질문을 던지고 이에 대한 정확한 답을 구할 수 있게 된다.

서민준 PM은 “우리가 학습한 모델이 실생활에 쓰일 수 있는지를 찾는게 앞으로의 과제”라면서 “보다 추상적인 대회도 많은데, 이번 연구는 실생활에 보다 쓰이기 쉬운 기술이기 때문에 이번에 배운 노하우가 잘 쓰일 것으로 기대한다”고 말했다.

또 황원석 연구원은 “야구를 예로 들면 현재는 경기 일정이나 결과만 물어볼 수 있는데, 이번 모델을 더욱 발전시키면 테이블 형태로 저장된 데이터를 물어볼 수 있을 것”이라며 “쇼핑의 경우도 어느 회사, 어느 가격 이하 등 다양한 조건을 줬을 때도 더 좋은 답을 찾을 수 있을 것”이라고 설명했다.

서민준 PM, 황원석 연구원은 이번 대회에서 좋은 성과를 낸 비결에 대해 오래된 경력과 경험을 바탕으로 한 방대한 지식보다는 빠른 학습 능력이 주효했다고 밝혔다. 또 수학적이고 논리적인 사고가 중요하다고 첨언했다. 나아가 당장의 성과보다는 중장기적인 관점에서 미래를 내다보고 기술 연구에 아낌없는 지원을 해주는 사내 개발 문화 또한 빠질 수 없는 요인이라고 강조했다.

관련기사

서민준 PM은 “우리가 네이버 내에서 이런 형태의 프로젝트를 진행한 유일한 팀일 것”이라며 “프로젝트를 발주할 때 중요하게 판단했던 건 우리가 확보하고 싶은 기술력, 어디에 쓰일지 현재로서는 명확하게 특정할 수는 없지만 미래에 반드시 중요하게 쓰일 프로젝트를 해보자였다”고 말했다. 이어 “긴 호흡을 갖고 연구할 수 있는 환경 또한 큰 도움이 됐다”고 덧붙였다.

황원석 연구원은 “AI 기술인 딥러닝과 머신러닝 분야에 물리학 개념이 많이 사용되다 보니 모델 구조나 아이디어를 만들 때 물리학 전공자로서 도움을 받는다”면서 “추가적인 데이터를 보완해 이번에 거둔 성과를 바탕으로 한 논문을 업데이트할 계획”이라고 말했다.