정부, AI 학습용 데이터 170종 4억8천만건 민간 개방

AI허브 홈페이지 통해..."민간 데이터 갈증 해소 기대"

방송/통신입력 :2021/06/18 10:19    수정: 2021/06/18 10:31

디지털 뉴딜 사업의 핵심으로 꼽혔던 데이터댐의 첫 수문이 열린다. 기업, 연구자가 스스로 하기 어려운 대규모의 데이터 구축을 예산사업으로 진행한 뒤 민간에 개방하기 시작한 것이다.

과학기술정보통신부와 한국지능정보사회진흥원은 인공지능 학습용 데이터 170종 약 4억8천만 건을 AI허브 홈페이지를 통해 개방한다고 18일 밝혔다.

과기정통부는 지난 2017년부터 기업, 연구자, 개인 등이 시간과 비용 문제로 개별 구축하기 어려운 인공지능 학습용 데이터를 구축해왔다. 지난해부터는 디지털 뉴딜 ‘데이터 댐’ 구축 프로젝트의 일환으로 구축 규모를 대폭 확대했다.

이날 개방하는 8대 분야 170종의 인공지능 학습용 데이터는 데이터 기획부터 구축까지 산업계, 전문가뿐만 아니라 많은 국민들이 참여한 결과물이란 점이 주목할 부분이다.

민간의 광범위한 수요를 바탕으로 분야별 산학연 전문가, 주요 활용기업 등이 직접 참여해 산업 파급효과가 크고 민간에서 대규모로 구축하기 어려운 인공지능 학습용 데이터를 구축했다.

사진 = 이미지투데이

데이터 구축에는 총 674개 기업과 기관이 대거 참여했고, 데이터 수집 과성에서는 크라우드소싱 방식으로 4만여명의 국민 손을 거쳤다.

AI허브에 개방되는 인공지능 학습용 데이터는 지난해 9월부터 8대 분야별 산학연 전문가 80여명이 참여하는 ‘품질자문위’를 거치면서 실제 수요자가 요구하는 데이터 품질을 확보했다.

이같은 데이터 개방을 통해 스타트업뿐 아니라, 대기업도 자체 확보하기 어려운 대규모 데이터를 제공한다는 점에서 그동안 국내 AI 산업계에서 가장 큰 걸림돌로 꼽은 문제인 ‘데이터 갈증’을 어느 정도 해소할 수 있을 전망이다.

관련기사

과기정통부와 지능정보원(NIA)은 품질관리 전문기관인 한국정보통신기술협회(TTA) 및 전문기업 등과 협력하여 고품질의 데이터를 안전하게 활용하도록 데이터 품질관리 수준을 대폭 강화해왔으며, 향후 개보위와 개인정보 전문기관인 한국인터넷진흥원(KISA) 등과도 지속적으로 협력을 강화해나갈 계획이다.

임혜숙 과기정통부 장관은 “댐의 물이 대지 곳곳으로 스며들어 꽃을 피우듯이, 이번에 공개되는 데이터들이 산업 곳곳에서 널리활용되어 혁신의 열매를 맺을 수 있기를 기대한다”며 “정부도 고품질의 인공지능 학습용 데이터를 지속적으로 제공하고, 누구나 데이터를 쉽게 활용하고 성과를 공유할 수 있는 환경을 조성하는 데 지원을 아끼지 않겠다”고 말했다.