MS, 음성 관련 AI 서비스 통합

마이크로소프트가 여러 종류로 나뉘었던 음성인식 관련 인공지능(AI) API서비스를 통합한다.

최근 미국 지디넷에 따르면, 마이크로소프트는 새로운 통합 스피치 서비스와 개발플랫폼을 준비중이다.

마이크로소프트의 통합 스피치 서비스와 SDK는 윈도, 오피스, 코타나, X박스, 홀로렌즈 등 다양한 서비스와 제품에 적용될 예정이다.

지난 빌드2018 컨퍼런스에서 마이크로소프트는 '코그니티브 서비스 스피치 SDK'란 세션에서 관련 계획을 발표했다.

마이크로소프트는 애저를 통해 코그니티브 서비스를 제공해왔다. 스피치 서비스는 코그니티브 서비스 중 하나로 제공될 예정이다.

현재 제각각 제공되는 음성인식 서비스를 포함한다. 빙 스피치, 커스텀 스피치, 스피치 트랜스레이션 등이다.

통합 스피치 API와 SDK는 모든 현대 플랫폼을 지원한다고 회사측은 설명했다. 온라인, 오프라인, 혹은 하이브리드나 배치 등의 환경에서도 스피치 서비스를 활용할 수 있게 한다는 것이다.

새 API와 SDK는 음성문자변환, 음성의도변환, 번역, 커스텀 키워드 강조 등을 제공하게 된다. 28개 언어를 통합 스피치 SDK에서 지원할 계획이다.

새 SDK의 프리뷰는 윈도10, 리눅스, 안드로이드 등을 지원한다. C#, C++, 자바 등의 언어를 지원한다. iOS와 맥OS는 곧 선보인다.

안드로이드는 스피치 디바이스 SDK를 통해 지원한다. 미리조정된 라이브러리가 마이크를 활성화한 특정 하드웨어와 연동된다. 이 SDK로 소음제거, 울림 감소, 원거리 음성 등의 기능을 제공한다. 음성문자변환과 음성번역 등을 지원한다.

관련기사