마이크로소프트가 여러 종류로 나뉘었던 음성인식 관련 인공지능(AI) API서비스를 통합한다.
최근 미국 지디넷에 따르면, 마이크로소프트는 새로운 통합 스피치 서비스와 개발플랫폼을 준비중이다.
마이크로소프트의 통합 스피치 서비스와 SDK는 윈도, 오피스, 코타나, X박스, 홀로렌즈 등 다양한 서비스와 제품에 적용될 예정이다.
지난 빌드2018 컨퍼런스에서 마이크로소프트는 '코그니티브 서비스 스피치 SDK'란 세션에서 관련 계획을 발표했다.
마이크로소프트는 애저를 통해 코그니티브 서비스를 제공해왔다. 스피치 서비스는 코그니티브 서비스 중 하나로 제공될 예정이다.
현재 제각각 제공되는 음성인식 서비스를 포함한다. 빙 스피치, 커스텀 스피치, 스피치 트랜스레이션 등이다.
통합 스피치 API와 SDK는 모든 현대 플랫폼을 지원한다고 회사측은 설명했다. 온라인, 오프라인, 혹은 하이브리드나 배치 등의 환경에서도 스피치 서비스를 활용할 수 있게 한다는 것이다.
새 API와 SDK는 음성문자변환, 음성의도변환, 번역, 커스텀 키워드 강조 등을 제공하게 된다. 28개 언어를 통합 스피치 SDK에서 지원할 계획이다.
새 SDK의 프리뷰는 윈도10, 리눅스, 안드로이드 등을 지원한다. C#, C++, 자바 등의 언어를 지원한다. iOS와 맥OS는 곧 선보인다.
안드로이드는 스피치 디바이스 SDK를 통해 지원한다. 미리조정된 라이브러리가 마이크를 활성화한 특정 하드웨어와 연동된다. 이 SDK로 소음제거, 울림 감소, 원거리 음성 등의 기능을 제공한다. 음성문자변환과 음성번역 등을 지원한다.
관련기사
- MS, C# 코딩 돕는 AI 도구 공개2018.05.21
- SSG닷컴, MS AI 기반 챗봇 서비스 구축2018.05.21
- 마이크로소프트365는 무엇인가2018.05.21
- 윈도10, 웹-앱 한 창에서 보는 기능 생긴다2018.05.21
현재의 마이크로소프트 트랜스레이터 앱과 서비스는 다음 버전 발표 때 새 스피치 서비스와 SDK로 옮겨진다. 현존하는 받아쓰기 엔진을 마이크로소프트 개러지 인큐베이터로 개발된 받아쓰기 기술로 교체하게 된다.
마이크로소프트는 수개월 내 정식 버전의 스피치 API와 SDK를 내놓을 것이라고 밝혔다.