미국·유럽·일본·중국 특허 명세서 40만건 영한 번역한다

한국지식재산연구원, NIA 시행 AI학습 데이터 구축 2차 사업 주관 기관 선정

컴퓨팅입력 :2021/08/03 11:32

한국지식재산연구원은 한국지능정보화사회진흥원(NIA)이 추진하는 ‘2021년 인공지능(AI) 학습용 데이터 구축 사업(2차)’에 주관기관으로 선정됐다고 3일 밝혔다. 연말까지 미국·유럽·일본·중국에 등록된 특허 명세서 총 40만건을 영-한 번역하고, 산업분류, 기술용어 정보가 포함된 AI 학습용 데이터셋을 구축한다.

한국지식재산연구원은 마크클라우드, 아이웹, 광운대(이석준 교수 연구팀) 및 국내 유수 특허법인 4곳(특허법인 로얄, 해율특허법률사무소, 특허법인KBK, 지심특허법률사무소)과 컨소시엄을 구성해 ‘산업정보 연계 주요국 특허 영-한 데이터 구축’ 사업을 진행한다.

한국지식재산연구원 컨소시엄은 지난해 ‘상표 이미지 및 상표 텍스트 AI 데이터 구축’ 사업의 참여기관들로 구성됐다. 우수한 사업 성과를 바탕으로 2년 연속 지식재산 분야 AI데이터 구축 사업에 선정됐다.

이번 사업은 총 20억원 규모다. 컨소시엄은 연말까지 AI 학습용 데이터 정제 및 가공, 검증 등을 위해 18명을 신규 고용하고, 특허 번역 분야의 경력단절 여성 및 청년 등 100명의 크라우드 워커를 채용할 계획이다.

총괄책임자인 한국지식재산연구원 임효정 박사는 "이번 AI 학습용 데이터 핵심은 ‘사람에 의한’ 정확한 특허문헌의 번역을 통해 주요국 특허에 500개의 산업분류를 부여하는 것”이라며 “한국지식재산연구원이 개발한 특허기술분류(IPC)-한국표준산업분류(KSIC)간 연계확률표를 활용해 특허문헌의 산업분류를 가이드함으로써 구축 데이터의 품질을 담보할 수 있을 것으로 기대한다”고 밝혔다.