솔트룩스, 국립국어원 '말뭉치 구축 사업' 수주

구어·준구어 원자료 수집해 말뭉치 구축하고 저작권 이용 계약

컴퓨팅입력 :2019/08/12 13:52

솔트룩스(대표 이경일)는 국립국어원의 '구어 자료 수집 및 원시 말뭉치 구축 사업'을 수주했다고 12일 밝혔다. 인공지능(AI) 산업 발전을 위한 대규모 고품질 우리말 자원 구축을 위한 사업이다.

국립국어원의 말뭉치 구축 사업은 TV, 라디오 등의 구어 원자료와 드라마, 연극 대본 등의 준구어 원자료를 수집해 말뭉치를 구축하고, 저작권 이용 계약까지 체결해 민간 활용 가치를 극대화하는 것이 목표다.

솔트룩스는 지난해 말뭉치 구축 전문인력을 통해 국립국어원 '국어 말뭉치 연구 및 구축 사업'을 수행했던 경험이 있다. 그 외에도 한국전자통신연구원(ETRI) '음성 DB 구축', 한국언론진흥재단 '뉴스 빅데이터 시스템 구축' 등 20년간 축적된 빅데이터 구축 경험과 4단계 품질관리 프로세스를 보유하고 있다.

솔트룩스 로고

이경일 솔트룩스 대표는 "AI 산업 및 국어·언어학계에 필요한 구어 말뭉치 구축을 위해 유용성 검증과 품질 확보라는 두 마리 토끼를 잡아야 한다"며 "자체 보유한 AI 원천 기술력과 서비스 개발 경험을 통해 성공적으로 사업을 수행하겠다"고 말했다.

관련기사