AI 데이터 품질 표준안 마련...세계표준 도전

과기정통부, 내년 6월까지 TTA 단체 표준 확정 후 세계표준 추진

컴퓨팅입력 :2020/10/05 16:20

과기정통부가 만든 인공지능(AI) 데이터 관련 품질 표준안이 세계 표준에 도전한다. 과기정통부는 우선 내년 6월까지 TTA를 통해 단체표준으로 확정하고, 이후 국제기구에 세계표준으로 제안할 예정이다.

5일 과기정통부는 ‘데이터 댐’ 핵심자원인 AI 데이터 관련 품질 개념과 범위, 세부 요구사항 등을 정립한 표준안을 개발, 내년 6월 한국정보통신기술협회(TTA)의 단체 표준으로 확정할 계획이라고 밝혔다. 과기정통부는 6일 TTA내 단체 표준화 기구(TTA PG 1005, 인공지능기반기술)에 이를 공식 제안. 관련 전문가 의견수렴을 거쳐 내년 6월에 최종 채택 및 확정될 전망이다. 이어 과기정통부는 관련 내용을 국제표준으로 이어질 수 있게 추진한다.

이번에 제안한 표준안은 TTA와 한국정보화진흥원(NIA)이 지난해 3월 개발한 '인공지능 학습용 데이터 구축 및 품질관리 공통기준'을 해외사례 분석, 인공지능 및 품질관리 전문가 자문 등을 거쳐 보완 및 구체화한 것으로, 인공지능 데이터 품질 정의를 '인공지능 기술(모델 및 알고리즘)에 활용되는 데이터가 다양성, 정확성, 유효성 등을 확보해 사용자에게 유용한 가치를 줄 수 있는 수준'으로 규정했다.

표준안은 자연어 처리, 자율자동차, 의료, 농축수산, 제조 등 다양한 분야에서 공통적으로 적용 가능한 범용 표준 형태로 개발됐다. 또 데이터 품질을 체계적으로 확보하고 호환성을 제고할 수 있게 데이터 수집‧정제‧가공‧품질검증‧활용 등 전주기 단계별로 필요한 표준 절차와 품질 요구사항 등을 정의하고 기본적인 데이터 규격을 담았다.

구체적으로 ▲원시데이터 수집단계의 다양성, 사실성 등 품질 요구사항과 파일 포맷, 해상도 등의 기술 적합성 요구 사항 ▲정제단계의 데이터 중복방지 및 비식별화 조치 요구사항 ▲가공단계의 객체 분류체계 및 라벨링 규격 요구사항 ▲품질검수·활용 단계의 유효성 등 검수 요구사항·방법 등을 포함했다.

과기정통부는 이번에 개발한 표준안을 이미 추경사업 과제(10대 분야, 150종 데이터)에 적용하고 있는데, TTA 내의 단체 표준화 기구 산학연 전문가 의견 수렴을 거쳐 신속히 단체 표준화를 추진하고, 관련 사항을 국립전파연구원 등을 통해 '인공지능 국제표준화회의(ISO/IEC JTC1/SC42)'에 제안, 국제표준화 성과로 이어지게 할 계획이다.

아울러, 올 연말까지 표준안을 바탕으로 인공지능 개발자, 공공기관 관계자 등이 인공지능 데이터의 품질을 보다 체계적으로 계획·관리할 수 있도록 하기 위해 자세한 설명 등을 포함하는 '인공지능 데이터 품질관리 가이드'를 개발, 배포할 계획이다.

아직 세계적으로 인공지능 데이터 품질 수준이 높지 않은 상황이다. 과기정통부에 따르면 세계적 정보통신기술 기업인 미국 마이크로소프트(MS)나 구글 등이 4~6년간 구축 및 업데이트해온 유명 개방 데이터셋도 데이터 정확도가 43~83% 수준에 불과하다. 과기정통부는 "2014년 구축을 시작한 MS 코코(COCO, Common Objece in Context), 2016년 구축을 시작된 구글 '오픈 이미지(Open Images)'의 현재 라벨링 정확도(재현율-라벨링해야 하는 사물 중 라벨링된 비율)는 각각 83%, 43%에 불과하다"며 "이는 세계적으로 인공지능 데이터 품질에 대한 체계적인 방법론이 정립되지 않은 중요한 원인 중 하나"라고 밝혔다.

관련기사

앞서 우리나라는 지난 4월 '인공지능 국제표준화회의(ISO/IEC JTC1/SC42)’에 인공지능 데이터(딥러닝) 품질 관련 사항을 신규 과제로 제안해 채택된 바 있고, 인공지능 품질 국제표준 논의는 이제 막 시작 단계다.

송규철 과기정통부 인공지능데이터팀장은 "이번에 개발한 표준안이 디지털 뉴딜 ‘데이터 댐’의 핵심자원인 인공지능 데이터의 품질을 향상시키고, 나아가 국가 전반의 인공지능 기술과 서비스의 성능을 높이는데 크게 기여할 것으로 기대한다"면서 "앞으로 국제표준화를 선도하고 우리나라가 인공지능 강국으로 도약하는데 더욱 노력하겠다"고 밝혔다.