벽돌깨기 게임 즐기는 AI, 네이처 게재

일반입력 :2015/03/02 10:29

구글에 인수된 머신러닝 전문업체 딥마인드가 아타리의 전자오락게임을 스스로 즐기는 인공지능(AI)을 개발해 유력 과학잡지에 소개했다.

최근 미국 지디넷 보도에 따르면, 딥마인드는 아타리 게임 49종을 스스로 학습해 마스터하는 인공지능 네트워크 ‘DQN(Deep Q-Network)’ 관련 논문을 과학잡지 네이처에 게재했다.

딥마인드의 DQN은 아타리2600에 기반해 설계된 49종류의 게임을 스스로 플레이한다. 널리 알려진 브레이크아웃, 리버레이드, 복싱, 비디오핀볼, 스페이스인베이더, 스타거너, 팩맨, 아스테로이드 등이다. 이 인공지능은 단순히 게임을 실행하는 게 아니라 횟수를 거듭할수록 수준을 높인다.

예를 들어, 벽돌깨기 게임을 맨 처음 플레이하면 공을 한번 튕겨내고 이내 끝나버린다. 하지만 100회, 200회, 300회, 400회 등으로 플레이 횟수를 늘려가면서 결국 인간의 수준을 뛰어넘는다. 게임을 거듭하면서 알고리즘이 높은 점수를 받을 수 있는 최고의 전략을 습득하기 때문이다.

작년 4월 딥마이든가 유튜브를 통해 공개한 동영상에 의하면, DQN은 브레이크아웃 플레이 400회를 넘어가면서 평균적인 인간보다 더 높은 점수를 기록했다. 벽돌깨기 게임에서 높은 점수를 받을 수 있는 벽돌 뒤쪽으로 공을 보내는 전략도 터득한다.

딥마인드 창업자인 데미스 하사비스와 논문공동저자 다르산 쿠마란은 블로그를 통해 “DQN은 동일한 네트워크 아키텍처와 파라미터 튜닝을 사용해 이런 류의 모든 게임을 어떤 장비서도 성실하게 작동한다”며 “가공하지 않은 스크린 픽셀과, 사용가능한 액션의 세트, 게임 점수를 입력하는 것만으로 가능하다”고 설명했다.

관련기사

DQN은 딥뉴럴네트워크(DNN)와 재실행 학습(Reinforcement Learning)을 합친 것이다. DQN이 플레이 가능한 모든 게임에서 인간보다 뛰어난 능력을 발휘하는 건 아니다. 아스테릭스, 아스테로이드, 팩맨 같은 게임의 경우 인간보다 못한 능력을 보여준다. 하지만 인간보다 높은 점수를 기록한 경우 숙련자보다 75% 높은 성과를 보였다.저자들은 DQN 같은 AI 기술이 구글 서비스의 성능을 더 높여줄 것이라고 기대했다. 구글나우를 통해 지금보다 더 복잡한 업무를 지시하는 것을 예로 들었다. ‘유럽에서 훌륭한 배낭여행지로 일정을 짜라’ 식이다.

구글은 작년 딥마인드를 4억달러에 인수했다. 구글에 인수된 뒤 딥마인드는 영국 옥스포드대학교 연구진과 공동연구를 진행중이다. 딥마인드는 이전에 테슬라모터스의 엘론 머스크 CEO의 투자를 받기도 했다.