발전하는 딥러닝...이미지 보며 컴퓨터와 대화까지

“자전거 핸들 위에 앉아 있는 저게 뭐야?” “새입니다."

영화 아이언맨의 인공지능 비서 자비스 같이 실시간으로 이미지를 보면서 사람과 대화할 수 있는 컴퓨터가 곧 현실화 될 것으로 보인다. 마이크로소프트(MS), 구글 등 IT기업들이 이미지를 탐지하고 사람이 물어보는 질문에 답할 수 있도록 컴퓨터를 훈련시키고 있다.

25일(현지시간) 미국 지디넷은 최근 MS가 주어진 이미지에 대해 자연어로 질문하면 자동으로 답변을 내놓는 '이미지-퀘스쳔 앤서링(image-question answering)’ 분야에 초점을 맞춰 인공지능 툴을 개발하고 있다고 소개했다.

예컨대 자전거 바구니 안에 강아지가 앉아 있는 이미지를 보고 사람이 “자전거 바구니에 앉아 있는 게 뭐야?”라고 컴퓨터에게 물어보면 자동으로 “강아지입니다”라고 대답해주는 기술이다. 이 기술은 MS연구소와 카네기멜론대학교가 공동으로 연구를 진행하고 있다.

MS연구소와 카네기멜론대학은 컴퓨터가 이미지를 보고 자연어 질문에 답할 수 있는 시스템을 함께 연구중이다.

MS연구소와 카네기멜론 대학 연구원들에 따르면 컴퓨터가 이렇게 자동으로 답변을 내 놓기 위해선 여러단계의 논리적 추론 과정을 거쳐야 한다. 시스템이 우선 "자전거, 바구니" 등 이미지 속의 객체를 인식해야 하고 질문에서 언급된 “앉아 있다”는 개념을 이해해야 한다. 그다음 점진적으로 관련이 없는 객체를 제외해 나가면서 답을 추론하는 것이다. MS연구소는 “딥 뉴럴 네트워크를 통해 이미지에서 질문과 관계가 적은 부분을 버리고 관계가 높은 부분을 결정하는 것”이라고 설명했다.

컴퓨터가 이미지를 인식하는 비전 기술과 사람이 말하는 방식을 이해하는 자연어처리 기술을 기반으로 이 분야 연구는 발전해 나가고 있다. 구글도 최근 인공 신경망 네트워크를 사용해 관련 분야에서 향상된 결과를 얻었다고 성과를 공개하기도 했다.(☞관련연구 링크)

발전하는 딥러닝...이미지 보며 컴퓨터와 대화까지

관련기사

지금 뜨는 기사

이시각 헤드라인

플랫폼 곳곳에 쓰이는 AI…"삶이 더 편해진다"

'아이오닉5 N'과 맞붙는 中 BYD, 고성능 전기차 '오션M' 출시

중소·중견 생명줄 공공SW사업, 수익률 높일 방법은

조국혁신당 "尹정부, 일본이 '라인' 삼키려는데 왜 침묵하나"

ZDNet Power Center