토익-토플 공부 돕는 진짜 AI는 뭐가 다른가

"한 달 간 문제를 풀고 오답노트만 반복해서 풀었는데 말도 안 되게 점수가 상승했어요."

토익 관련 학습교재나 인터넷 강의 등에 대해 여러 커뮤니티에서 흔히 볼 수 있는 후기다. 그러나 학습자가 인공지능(AI) 기술의 도움을 받아 이 같은 성과를 냈다고 하면 얘기가 달라진다.

교육 분야 AI 스타트업인 뤼이드(Riiid!)는 문제를 계속해서 풀기만 하면 토익 점수를 올릴 수 있는 '산타토익'이라는 모바일앱을 서비스하고 있다. 30만여명의 사용자를 확보한 이 앱은 애플 앱스토어에서는 지난달 기준 교육 카테고리에서 앱 내 결제 매출 2위라는 성적을 거두기도 했다.

지디넷코리아가 오는 22일 서울 여의도 포시즌스 호텔에서 주최하는 '아시아테크서밋 2017(ATS 2017)'에서 뤼이드 장영준 대표는 'AI, 교육의 틀을 바꾸다'를 주제로 산타토익이 어떤 성과를 거두고 있는지, 교육 분야에 마케팅 수단으로만 쓰이는 가짜 AI가 아닌 진짜 AI가 뭔지를 구별할 수 있는 방법 등에 대해 소개할 예정이다.(☞관련링크)

뤼이드 장영준 대표는 "연초만 하더라도 연구개발이 한창이라 무료로 서비스 하면서 데이터를 모으는 과정이었다면 9월부터 시작한 유료 서비스에서는 이전과 비교해 완전히 다른 제품으로 업그레이드 됐다"고 말했다. 모아진 데이터로 학습 과정을 거친 머신러닝 알고리즘이 그만큼 정교해졌다는 뜻이다.

현재 이 회사는 교육 분야에 AI를 접목시켰을 때 확인된 성과를 바탕으로 중국 토플 시장까지 넘보고 있다.

■교육 AI, 블랙박스냐 아니냐로 진짜-가짜 구분

장 대표는 교육 분야에도 진짜 AI와 가짜 AI가 있다고 말한다. 뭐가 다르다는 것일까?

그는 블랙박스를 쓰냐 아니냐에 따라 구분할 수 있다고 설명한다.

가짜 AI는 개발자들이 일일이 A라는 데이터에 대해서는 B라고 말해주라는 식으로 특정한 룰이나 연산 알고리즘을 사용한다. 데이터가 아무리 많이 쌓인다고 하더라도 같은 규칙에 따라 나온 결과값이 바뀌지 않는다는 뜻이다.

반면 진짜 AI는 블랙박스와 같다. "머신러닝 알고리즘이 처음에는 멍청하다가도 데이터를 많이 입력 할수록 인간을 뛰어 넘는 결과값을 내놓을 수 있게 된다"는 설명이다.

산타토익에 적용된 머신러닝 알고리즘은 세계 2대 AI 학회로 불리는 '신경정보처리시스템학회(NIPS) 2016' 학술지에 게재될 정도로 가능성을 인정 받았다.

'학습 분석을 위한 머신러닝 접근법 : 전문가와 협업 필터링 혹은 전문가 회귀?(Machine Learning Approaches for Learning Analytics : Collaborative Filtering Or Regression With Experts?)'라는 논문은 뤼이드와 카이스트 서창호 교수, 카이스트에서 연구활동 중인 UC버클리대 이강욱 박사 등이 공동저자로 이름을 올렸다.

■ 사람 노력 최소화해도 뛰어난 AI 교사 나온다

뤼이드는 크게 3가지면에서 기존 어댑티브 러닝 알고리즘과 뤼이드의 AI 알고리즘이 구분된다고 설명한다. 어댑티브 러닝 알고리즘은 기본적으로 사람이 일일이 모든 데이터에 대해 특징을 꼬리표처럼 붙이는 태그를 만들고 이를 통해 취향을 분석해 비슷한 유형의 사용자들에게 맞춤형 콘텐츠를 추천해준다. 반면 뤼이드의 경우 블랙박스와 같은 머신러닝 알고리즘에 계속해서 데이터를 학습시키면서 더 정교하게 개인화된 학습경로를 알려준다.

일일이 태그를 붙이는 기본적인 어댑티브 러닝 알고리즘은 사람이 직접 업무를 수행해야하는 탓에 높은 비용이 들지만 뤼이드의 AI 알고리즘은 데이터를 확보한 뒤 이를 알고리즘에 학습시키기만 하면되기 때문에 인건비가 거의 들지 않는다.

정확성 면에서도 태깅 방식에 비해 인간의 추론이 배제된 AI 알고리즘이 90% 수준의 정확도를 보인다.

또한 태깅방식은 새로운 분야로 확장하기 위해 새로운 데이터가 필요하고 일일이 태깅 작업이 추가로 진행돼야 한다.

반면 뤼이드의 AI 알고리즘은 새로운 분야에 대해 데이터가 입력되는 순간부터 기계가 학습을 시작해 스스로 결과 데이터를 산출해내면서 사용자들을 모델링하고 적절한 행동을 추천한다.

산타토익에 적용된 머신러닝 알고리즘의 경우 20만명 토익 응시자들로부터 2천만건 문제풀이 데이터를 알고리즘에 학습시켰다. 이를 토대로 응시자들이 앞으로 어떤 문제를 틀릴 지, 어떤 보기를 선택해서 틀릴지를 90% 이상 확률로 예측한다.

그 다음으로는 추천 알고리즘을 통해 응시자가 어떤 부분을 학습해야 가장 큰 폭으로 점수가 상승할지에 대해 연산해 학습 커리큘럼을 구성하는 과정을 반복한다.