인공지능이 사람보다 게임도 잘한다?

구글 딥마인드, 31개 클래식 아케이드 게임서 사람 격파

컴퓨팅입력 :2015/09/24 10:23    수정: 2015/09/24 10:38

황치규 기자

체스 게임에서 컴퓨터가 인간을 누른데 이어 이번에는 비디오 게임 대결에서도 인공지능 기술이 실제 게이머보다 점수를 많이 따는 사례가 이전보다 크게 늘었다는 분석 결과가 나왔다.

구글이 운영하는 딥마인드 인공지능( Artificial Intelligence: AI) 플랫폼은 지난해 전통적인 아케이드 게임인 퐁을 갖고 인상적인 플레이를 펼쳐 관심을 끌었다. 이후 구글은 게임 동작에 필요한 조이스틱을 보다 정교하게 다룰 수 있도록 딥마인드 알고리즘을 개선해왔다.

테크리퍼블릭에 따르면 이를 기반으로 딥마인드는 아타리2600같은 1980년대 제작된 다수 게임들에서 전문적인 게임 플레어를 누를 수 있는 수준에 올라섰다. 딥마인드 연구팀은 23(현지시간) AI 성능 향상을 이끄는 강화된 딥마인드 학습 소프트워어에 대한 내용을 웹에 공개했다.내용을 보니 31개 게임에서 딥마인드가 사람을 앞섰다. 딥마인드 이전 버전과 비교하면 큰 발전이다. 이번과 같은 테스트 환경에서 딥마인드 이전 버전이 사람을 아긴 게임은 23개였다.

테크리퍼블릭은 업데이트를 통해 딥마인드는 아스테릭스, 뱅크 헤이스트, 큐버트, 업앤다운, 잭슨 등 다양한 게임들에서 전문적인 게이머에 근접하는 수준에 올라섰다고 전했다.

이전 시스템의 경우 아스테릭스, 더블덩크, 잭슨 게임에서 전문 게이어들이 획득한 전체 점수와 비교해 일부의 성과를 내는데 그쳤지만 이번에 나온 새 시스템에선 상황이 바뀌었다. 더블덩크 대결 결과 딥마인드가 사람보다 압도적으로 많은 점수를 받았다고 한다.

딥마인드는 딥 큐 네트워크(Deep Q-network)라는 신경망에 기반한다. 딥 큐 네트워크는 커넥티드 레이어로 이뤄진 컴퓨터 노드로 구성된다. 이를 기반으로 딥마인드는 각각의 게임으로부터 픽셀을 끌어와 다양한 요소들을 수행하기 위한 추론을 하게 된다.

관련기사

딥마인드 업데이트 버전에 적용된 더블 큐 러닝(the Double Q-learning) 기술은 이전에 비해 실수를 줄이는 성과로 이어졌다. 더블 큐 러닝은 게임을 할 때, 특정 액션에서 딥마인드가 상황이 긍정적이라고 과대평가하는 것을 줄였다고 한다.

업그레이드에도 불구하고 특정 게임들은 답마인드가 소화하기에는 여전히 한계가 있다. 에스트로이드, 미스팩맨과 같은 게임에서 딥마인드는 고전을 면치 못하고 있다. 딥마인드가 미스팩맨과 같은 복잡한 게임을 커버하기는 현재로선 무리가 있어 보인다. 테크리퍼블릭에 따르면 지금의 한게는 딥마인드 시스템이 과거 4개 게임 프레임만 볼 수 있다는 것에서 기인한다. 시간적으로 대단히 짧은 것만 파악할 수 있지, 장기적인 전망까지는 제대로 이해하지 못한다는 얘기다.