타임소프트, 2차 AI 음성 학습데이터 구축사업 수주

컴퓨팅입력 :2022/10/11 17:43

타임소프트(대표 김철희)는 ‘2022년 인공지능 학습용 데이터 구축사업 2차’ 음성 데이터 구축 부문 뉴스 대본 및 앵커 음성데이터 주관기관으로 선정됐다고 밝혔다.

과학기술정보통신부가 주관하고 한국지능정보사회진흥원(NIA)이 추진하는 본 사업 과제는 인공지능에 활용할 수 있는 텍스트를 음성으로 변환하는 기술(TTS)에 적용할 데이터셋을 구축하는 과제다. 아나운서 50여명 이상 참여해 뉴스 대본 4천 건을 1천 시간의 음성데이터로 전환하는 작업이다.

정치, 경제, 사회, 문화, 국제, 지역, 스포츠, IT과학 등 여러가지 뉴스 분야의 대본을 통하여 전, 현 직 아나운서의 음성을 통해 품질 높은 학습데이터를 구축한다.

타임소프트

본 과제를 통해 뉴스 대본 텍스트를 아나운서 목소리로 뉴스 방송, 기계 독해 연구, 비정형 데이터 질의-응답, 대화형 시스템 등의 실생활에 적용 활용할 수 있다. AI 스피커, 뉴스기사를 읽어주는 AI챗봇, 비서 서비스 등 여러 분야에 활용 가능하다.

본 사업은 타임소프트가 주관기관으로 하며, 케이엘큐브와 코난테크놀로지, 에이스솔루션등 음성데이터 구축 전문 기업으로 컨소시엄이 구성되었다. 또한 봄온 아카데미, 스포티비 아카데미가 본 사업에서 구축된 학습 모델을 활용할 수요기관으로 참여했다.

관련기사

음성 데이터 구축 부문 뉴스 대본 및 앵커 음성데이터의 학습데이터가 구축되는 내년 상반기에 AI허브에 공개될 예정이다.

타임소프트는 한국지능정보사회진흥원(NIA)에서 추진한 2020년 한국인 대화 음성, 2020년 한국어 방안(강원도), ‘21년 복지분야 콜센터상담 등 음성데이터 인식(STT) 분야에 인공지능 학습데이터 구축사업도 진행했다.