인공지능 “사진을 보고 그 다음을 예측한다”

컴퓨팅입력 :2016/11/30 11:04

매사추세츠공과대학(MIT) 연구진이 정지된 사진을 보고 그 다음 장면을 예측할 수 있는 인공지능 기술을 개발했다.

미국 지디넷은 MIT 머신러닝 연구진들이 개발한 인공지능 29일(현지시각) 소개했다.

이번에 개발된 기술은 기계에게 정지된 사진을 보여주면 그 다음 장면을 예측해 짧은 애니메이션 영상으로 보여주는 것이다. 예를 들자면, 바닷가 사진을 보여주면 파도가 치는 풍경을 만들어내고 골프장 사진에는 골퍼가 잔디를 걷는 동작을 만들어 주는 식이다.

정지된 사진을 보고 그 다음 장면을 예측할 수 있는 인공지능 기술을 MIT가 개발했다. (사진=픽사베이)

연구진은 두 개의 신경망 인공지능에 200만 개의 플리커 동영상을 5,000시간 동안 보여주면서 학습시켰다. 연구진은 골프코스, 해변, 기차역, 병원, 어린 아이 등으로 구성된 주요장면을 집중적으로 학습시켰다.

사진=MIT

그 결과 머신러닝 시스템은 사진을 통해 다음 모습을 예측해 동영상으로 만들어 냈다. 영국 과학 잡지 뉴사이언티스트는 이 시스템이 만들어낸 동영상은 길이가 1~2초 정도로 짧았고 화질도 아주 선명하지 못했으나 주어진 장면에서 도출할 수 있는 미래 영상을 정확하게 보여줬다고 밝혔다.

이 기술은 두 개의 신경망이 서로 경쟁하듯 학습하는 ‘적대적 학습’ 머신러닝 기술을 기반으로 했다. 하나의 신경망은 사진을 보고 미래를 보여주는 동영상을 만들어 내고, 다른 하나는 실제 이미지와 생성된 동영상을 구별해 맞는 지 판단한다.

이 알고리즘은 향후 보안 전략이나 자율주행자동차 등에도 적용할 수 있다. 예를 들어, 보안 카메라에 찍힌 사람의 이미지를 보고 다음 동작을 예측해 동영상을 만들 수 있는 식이다. MIT 박사과정 칼 본드릭(Carl Vondrick)는 이 기술이 향후 도우미 로봇이 장애물을 피하거나 움직이는 데 도움을 줄 수도 있다고 밝혔다.

관련기사

칼 본드릭은 예전에도 악수, 포옹, 키스 등 사람의 제스처를 예측하기 위해 딥러닝 모델에 유튜브 영상과 TV 프로그램 영상을 학습시킨 적이 있다.

연구진은 이 알고리즘을 더욱 발전시켜 동영상 재생 시간을 늘릴 계획이다.