구글 딥마인드, 바둑 이어 ‘퀘이크3’서도 인간에 승리

다수의 AI가 동시에 참가해 학습하는 새로운 강화학습 방법 도입

디지털경제입력 :2018/07/05 11:02

인공지능(AI) 알파고로 전 세계 바둑팬을 깜짝 놀라게 만든 구글 딥마인드가 슈팅게임 퀘이크3 전용 AI를 제작했다.

북미 IT 전문매체인 더버지 등 외신은 딥마인드가 인공지능(AI)에게 퀘이크3를 학습시켜 사람과의 대결에서 승리하는데 성공했다고 4일(현지시간) 밝혔다.

딥마인드에 따르면 ‘승리를 위해’(FTW, For the win)라고 명명된 AI는 다수의 AI가 동시에 게임에 참가하는 새로운 강화학습 방법이 사용됐다. 1대 1이 아닌 대량의 AI가 2대 2로 4명씩 팀을 이뤄 경쟁하는 토너먼트 방식으로 진행됐으며 이용자간 협력을 배우기 위해 40명의 실제 사람이 참가하기도 했다.

구글 딥마인드의 FTW 인공지능 강화학습 진행 장면.(사진=구글 딥마인드 블로그)

강화학습을 마친 AI는 실제 고수 이용자보다 높은 점수와 승률을 기록한 것으로 나타났다. 학습에는 퀘이크3의 모드 중 하나인 깃발뺏기를 사용됐다.

이 모드는 상대 지역에 등장하는 깃발을 자신의 진영으로 가져와야 점수를 얻는 방식으로 단순히 적을 쓰러트리는 것으론 점수를 얻을 수 없어 보다 전략적이고 복합적인 플레이가 요구된다.

관련기사

다만 원작은 맵에 단차가 존재하는 등 복잡한 구조로 이뤄져 있어 이를 AI가 학습하는데 오래 걸릴 것을 우려해 딥마인드는 맵을 단순화한 버전에서 테스트를 진행했다.

딥마인드 측은 “AI는 아무런 정보가 없었지만 상대방 진영의 깃발을 우리 진영으로 가져오는 기본 전략을 비롯해 우리 깃발을 지키기 위해 수비를 하고 주요 포인트에서 자리잡는 등 실제 사람이 사용하는 전략과 팀플레이를 배웠다”며 “이번 테스트는 다수의 AI 동시에 학습에 활용하는 방법을 연구하기 위한 것으로 이를 통해 강화학습의 효율을 높일 수 있다고 생각한다”고 전했다.

구글 딥마인드의 FTW AI 학습 결과.(이미지=구글 딥마인드 블로그)