목소리를 '포샵'하라?

어도비, 실험적 목소리 편집툴 '프로젝트 보코' 공개

컴퓨팅입력 :2016/11/10 08:22    수정: 2016/11/10 08:28

목소리에도 '포샵질'을 할 수 있는 시대가 열렸다.

흔히 인물 사진 보정 행위를 '포샵질'이라 부른다. 어도비에서 만든 프로그램 '포토샵'이 대중적인 사진편집툴로 통하기 때문이다. 그런데 최근 어도비가 시연한 신기술은 인물의 겉모습이 아니라 목소리를 편집할 수 있는 프로그램의 등장을 예고했다. 포토샵처럼 정식 상용 제품으로 시판될 수 있을지 주목된다.

유튜브에 게재된 어도비 프로젝트 보코 시연 현장 영상 한 장면.

외신들은 어도비가 이달초 연례컨퍼런스 '맥스(MAX)' 현장에서 '프로젝트 보코(VoCo)'를 소개했다고 전했다. 보코는 실제 인물의 육성을 녹음한 뒤 그 말소리를 편집할 수 있는 기술이었다. 녹음된 말의 발음이나 어휘를 보정하는 데 유용한 동시에, 당사자가 실제 한 적 없는 말을 한 것처럼 조작하는 데 악용될 가능성을 품었다.

[☞참조링크: Adobe's VoCo voice project: Now you really can put words in someone else's mouth]

[☞참조링크: Adobe Voco 'Photoshop-for-voice' causes concern]

보코는 이렇게 작동한다. 우선 프로그램이 사람 말소리를 20분가량 듣고 녹음한다. 이후 그 사람이 말한 문장을 텍스트로 보여주는데, 누구든지 문서를 편집하듯 이 텍스트를 고치는 것으로 그에 해당하는 말소리도 변경할 수 있다. 변경된 말소리도 원래 그 사람의 목소리처럼 들린다. 당사자가 전혀 말한 적 없는 단어나 어구를 발음한 것처럼 자연스럽게 꾸며낼 수 있단 얘기다.

프로젝트 보코에 적용된 알고리즘은 미국 프리스턴대학교와 어도비 리서치가 협력해 만들어졌다. 어도비 측은 프로젝트 보코가 원하는 내용의 낱말이나 어구를 문자로 입력하는 것만으로 말소리를 바꾸거나 말을 삽입할 수 있게 해준다고 설명했다. 콘텐츠 제작자들이 사람의 말소리, 대화, 내레이션을 편집해 오류를 고치거나 스토리라인을 바꿀 수 있도록 돕는다는 게 목표라고 한다.

어도비 소속 연구자 진제위(Zeyu Jin)는 프린스턴대학 측 연구자 애덤 핀클스타인 그리고 다른 어도비 리서치 멤버들과 협력해, 프로젝트 보코에 녹인 기술에 관련된 논문을 올초 게재했다. 논문은 보코의 기술처럼 '보이스 컨버전(voice conversion)' 위해 여타 방식보다 확연히 나은 결과물을 얻도록 해 주는 'CUTE 기법'을 설명하고 있다.

지난 4일 미국 지디넷 보도에 따르면 보코가 실제 제품으로 출시될 것인지는 확실치 않다. 만일 출시돼 누구나 이런 기술을 쓸 수 있게 된다면, 한편으론 목소리가 다양한 콘텐츠 창작에 활용될 가능성이 열리겠지만, 다른 한편으론 사람들이 어떤 녹음된 말소리가 이런 기술을 통해 조작된 결과물인지 아닌지 믿기 어려워질 것이다.

관련기사

지난 7일 영국 BBC도 보코를 소개하며 비슷한 우려를 제기했다. 보도에 스털링대학교의 미디어테크놀로지 담당교수 에디 보그스 레이 박사가 "어도비 프로그래머들은 목소리 조작에 혁신적인 것을 만드는 데 흥분한나머지 그 기술이 잠재적으로 오용돼 초래될 윤리적 딜레마를 무시한 것으로 보인다"고 비판한 발언이 인용됐다.

어도비 외부에서 보코를 활용한 사례가 전혀 없진 않다. 팟캐스트 수정이나 오디오북 녹음 편집 작업에 목소리 출연자나 성우를 재섭외하는 과정 없이 보코를 쓰는 고객사가 있다. 그러나 어도비는 이게 보코를 곧 상용화할 계획을 뜻하진 않는다고 선을 그었다. 또한 이 기술 오용에 따른 문제를 예방하기 위해 이 기술의 사용여부를 탐지할 방법도 연구 중이라고 밝혔다.