인공지능(AI) 기업 솔트룩스가 '한국어 방언 AI 데이터 구축 사업'의 일환으로 강원·충청·전라·경상·제주 사투리를 사용하는 해당 지역 10년 이상 거주자들을 모집한다고 4일 밝혔다.
본 사업은 과학기술정보통신부와 한국정보화진흥원(NIA)이 주최·주관하는 ‘인공지능 학습용 데이터 구축’ 사업 중 하나로, 앞으로 인공지능이 각 지역별 사투리도 잘 알아들을 수 있도록 인공지능 학습용 방언 데이터를 대규모로 수집, 가공하는 프로젝트이다.
이번 모집에서는 '화자', '전사', '검수' 등 3가지 분야에서 참가자를 모으고 있다.
먼저 화자 분야의 참가 대상 연령은 20~70대로 폭 넓다. 화자 참가자는 45분 정도 제시된 주제에 대해 이야기하는 것을 녹음하게 된다. 비대면으로는 화상회의 서비스 '줌'을 통해 녹음하고, 대면으로는 오프라인 각 지역 녹음 장소에 방문해 진행한다.
전사 분야 참가자는 녹음 파일을 사전의 단어를 입력하는 업무를 줌을 통해 비대면으로 진행한다. 화자와 전사의 경우 강원·충청·전라·경상·제주 등 5개 지역에서 10년 이상 거주한 사투리 사용자여야 한다.
검수 참여자는 녹음 및 전사된 파일의 품질을 검수하며 각 지역 참여기관에 계약직으로 참여해 대면으로 작업해야 한다.
관련기사
- 솔트룩스, 한국지역난방공사 빅데이터 정보화 사업 선정2020.10.20
- 솔트룩스, 특수환경 자율주행 AI 데이터 구축 사업 주관기업 선정2020.09.28
- 솔트룩스, AI 학습용 데이터 구축 사업 주관·참여기업 선정2020.09.22
- 솔트룩스, 3세대 'AI 클라우드' 정식 출시2020.08.31
솔트룩스가 주관사로서 이번 사업을 이끌며, 컨소시움에는 지역언어, 데이터 구축, 품질 검수 등 부문별 전문성을 보유한 15개 기관이 참여한다. 각 지역별 수행기관은 ▲강원도-인피닉, 디큐, 타임소프트 ▲경상도-소리자바, 코아 인포메이션 ▲전라도-솔트룩스 광주인공지능센터, 디그랩, 도담에스엘 ▲제주도-이스트소프트, 사람과 숲, 제주국제자유도시개발센터, 데이터메이커 ▲충청도-디그랩, 나라지식정보, 엑소텍이 맡았다.
이번 사업은 12월 말까지 데이터 구축을 완료할 예정으로, 현재 크라우드소싱에 참여할 인력을 계속해서 모집 중이다. 사업 참여 희망자는 솔트룩스 홈페이지 홍보센터 메뉴에서 관련 공고를 확인한 후 신청하면 된다.