타임소프트(대표 김철희)는 ‘2022년 인공지능 학습용 데이터 구축사업 2차’ 음성 데이터 구축 부문 뉴스 대본 및 앵커 음성데이터 주관기관으로 선정됐다고 밝혔다.
과학기술정보통신부가 주관하고 한국지능정보사회진흥원(NIA)이 추진하는 본 사업 과제는 인공지능에 활용할 수 있는 텍스트를 음성으로 변환하는 기술(TTS)에 적용할 데이터셋을 구축하는 과제다. 아나운서 50여명 이상 참여해 뉴스 대본 4천 건을 1천 시간의 음성데이터로 전환하는 작업이다.
정치, 경제, 사회, 문화, 국제, 지역, 스포츠, IT과학 등 여러가지 뉴스 분야의 대본을 통하여 전, 현 직 아나운서의 음성을 통해 품질 높은 학습데이터를 구축한다.
본 과제를 통해 뉴스 대본 텍스트를 아나운서 목소리로 뉴스 방송, 기계 독해 연구, 비정형 데이터 질의-응답, 대화형 시스템 등의 실생활에 적용 활용할 수 있다. AI 스피커, 뉴스기사를 읽어주는 AI챗봇, 비서 서비스 등 여러 분야에 활용 가능하다.
본 사업은 타임소프트가 주관기관으로 하며, 케이엘큐브와 코난테크놀로지, 에이스솔루션등 음성데이터 구축 전문 기업으로 컨소시엄이 구성되었다. 또한 봄온 아카데미, 스포티비 아카데미가 본 사업에서 구축된 학습 모델을 활용할 수요기관으로 참여했다.
관련기사
- 에스에이티정보-타임소프트, 공공 빅데이터산업 육성 MOU 체결2021.02.24
- [영상]지능형 빅데이터 플랫폼 전문기업, 타임소프트2021.01.20
- 새해 AI 학습용 데이터 310종 구축에 5797억원 투자2022.01.20
- 정부, AI 학습용 데이터 44종 추가 개방2021.06.25
음성 데이터 구축 부문 뉴스 대본 및 앵커 음성데이터의 학습데이터가 구축되는 내년 상반기에 AI허브에 공개될 예정이다.
타임소프트는 한국지능정보사회진흥원(NIA)에서 추진한 2020년 한국인 대화 음성, 2020년 한국어 방안(강원도), ‘21년 복지분야 콜센터상담 등 음성데이터 인식(STT) 분야에 인공지능 학습데이터 구축사업도 진행했다.