정부, 올해 AI데이터 150종 구축···다음달 6일부터 접수

2925억 투입...헬스케어 등 6대 지정 분야 130종+자유 공모 20종

컴퓨팅입력 :2021/03/11 12:00    수정: 2021/03/11 15:09

과기정통부가 인공지능(AI) 강국 코리아 달성을 위해 2925억원을 투입해 AI학습용 데이터 150종을 구축한다. 다음달 6일부터 약 20일간 접수를 받는다. 앞서 사업 공모를 이달 12일부터 다음달 12일까지 한달간 시행한다.

11일 과기정통부는 AI 개발에 필수인 양질의 인공지능 학습용 데이터를 대규모로 구축 및 개방하는 '인공지능 학습용 데이터 사업' 공모를 12일부터 시작한다고 밝혔다.

이 사업은 기업, 연구자, 개인 등이 개별로 구축하기 어려운 인공지능 학습용 데이터를 대규모로(’25년까지 1300종) 구축해 AI허브(www.aihub.or.kr)를 통해 개방하는 사업이다. 인공지능 학습용 데이터 구축 과정(수집·가공·검수)은 대부분 대규모의 반복 수작업이 수반되는데 인공지능 개발 프로젝트의 80%를 차지하고 있다.

당국은 그동안(’17년~’20년) 한국어(음성·자연어), 헬스케어 등의 분야에서 총 191종의 데이터를 구축했다. 올해는 150종의 인공지능 학습용 데이터를 추가로 구축한다. 지난해 구축한 데이터 170종은 품질검증 후 올 상반기 중 순차적으로 개방한다.

올해 구축하는 인공지능 학습용 데이터 150종은 6대 핵심분야(음성·자연어, 비전(영상·이미지), 헬스케어, 교통·물류, 농·축·수산, 재난·안전·환경)의 지정 공모과제 130종과 자유 공모과제 20종(지역 과제 10종, 자유 과제 10종)이다. 지정 공모 과제 중 지역과제는 컨소시엄 구성 시 지자체 참여가 필수다. 또 자유 공모과제 10종은 6대 핵심분야별 각 1종과 , 6대 핵심분야 외 4종으로 추진된다.

당국은 지정과제 선정을 위해 분야별 산·학·연 전문가로 구성한 과제기획위원회에서 산업·기술 전망 분석을 토대로 6대 핵심 분야를 선정했다. 또 민간·공공을 아우르는 광범위한 수요조사를 실시(’20.10~11월)한 결과 발굴된 891개(민간 751개, 공공 140개) 데이터 수요를 바탕으로 분야별 전문가 및 활용 기업 검토와 온라인 의견 수렴 등을 거쳐 130개 지정 공모과제를 확정했다.

이번 사업을 통해 구축하는 인공지능 학습용 데이터는 언어·시각지능 등 인공지능 선도 기술 경쟁력을 확보하고, 자율주행자동차 등 산업 분야 혁신과 국민 건강·안전 증진 등 국민의 삶에 밀접한 인공지능 서비스 개발을 뒷받침할 수 있을 것으로 과기정통부는 기대했다.

2925억원의 대규모 예산을 투입하는 이번 사업을 통해 인공지능 산업 발전 기반을 구축함과 동시에 지속되는 코로나발 일자리 위기의 충격을 완화할 것을 목표로 잡았다. 이를 위해 수행기관의 직접고용을 의무화(1억원당 2.4명 이상)하고, 데이터 구축 과정에 국민 누구나 참여할 수 있는 크라우드소싱 방식을 적극 도입하도록 관련 예산비중을 선정평가에 반영한다.

관련기사

또, 수행기관의 크라우드소싱 참여인력 교육 등 성장지원 방안을 평가에 반영해 참여인력의 경력개발 및 안정적 고용을 유도할 방침이다.

과기정통부는 이번 사업 데이터 구축에 참여하려는 국민들이 과제별 크라우드소싱 플랫폼의 일자리 정보를 한 곳에서 확인할 수 있게 AI 허브 홈페이지(www.aihub.or.kr)에 제공할 예정이다. 이 본 사업 공모와 관련한 상세한 안내는 과학기술정보통신부 홈페이지(www.msit.go.kr)와 한국지능정보사회진흥원 홈페이지(www.nia.or.kr)에 12일 공지된다. 참여를 원하는 기관 및 기업은 과제별로 컨소시엄을 구성해 지원하면 된다.