정부가 운영하는 인공지능(AI) 학습용 데이터 플랫폼 'AI 허브'가 부실하다는 목소리가 나왔다. AI 허브에 등록된 공공데이터 품질 수준이 낮다는 지적이다.
전문가들은 AI 허브에 기업이 직접 데이터 올리는 방식을 개편해야 한다고 입을 모았다. 기업이 AI 허브에 데이터를 공유한다는 건 영업 비밀을 공개하는 것과 같은 이치이기 때문이다. 이 외에도 입찰 방식을 간소화하고 과금을 매기는 등 세밀한 정책 설계가 필요하다는 의견도 나왔다.
정부는 2017년부터 내년까지 1천300여종으로 이뤄진 AI 학습용 공공데이터 조성 목표로 AI 허브를 개설했다. 현재 전담 기관은 한국지능정보사회진흥원이다.
감사원에 따르면 2020년부터 현재까지 진행된 데이터 중 122종 데이터 품질에 문제가 있는 것으로 전해졌다. 여기에 투입된 사업비만 1천148억원이다.
"데이터 직접 공유, 보안·품질↓…'연합학습' 채택 필요"
기업이 데이터를 AI 허브에 직접 공유하는 방식이 개편돼야 한다는 주장이 이어지고 있다. 자사 핵심 데이터를 납품하는 순간 기업 영업 비밀이 공개된다는 이유에서다.
한 업계 관계자는 "그동안 기업은 고의적으로 품질 낮은 데이터만 골라 공유하는 분위기"라며 "일회성 납품일뿐더러 데이터 품질을 직접 측정하기 힘들기 때문"이라고 귀띔했다.
전문가들은 연합학습으로 데이터 공유 환경을 조성해야 한다고 목소리를 높였다. 기업이 자사 기기나 서버로 데이터를 훈련한 후, 업데이트 결과만 중앙 서버에 공유하는 방법이다. 다른 기업들은 중앙 서버에 공유된 것만으로 AI 모델을 개발할 수 있다.
이때 데이터는 중앙 서버로 전송되지 않고, 데이터 생산자 기기나 서버에 보관된다. 데이터 정보보호를 높일 수 있는 셈이다. 직접 데이터를 물리적으로 공유하는 방식과 다르다.
이경전 경희대 빅데이터·빅데이터응용학과 교수는 "기업이 자사 데이터를 직접 공유하는 것보다는 연합학습 방식이 효과적"이라며 "결과적으로 AI 허브에 등록된 데이터 품질에 긍정적인 영향을 미칠 것"이라고 본지에 전했다.
김진형 카이스트 명예교수도 "데이터 댐 과제에서 연합학습을 허용하고 과금을 설정하는 등 섬세한 정책 설계가 절실하다"고 말했다.
"입찰 방식 바꿔야 수익 좋은 기업도 참여할 것"
공공 입찰 방식에도 전면적 수정이 필요하다는 주장도 나왔다.
소모적인 검토가 지나치다는 지적도 나왔다. 불필요한 서류 검토로 인해 정부 사업 필요 없는 수익성 좋은 기업이 낮은 참여도를 기록했다는 입장이다.
관련기사
- 데이터를 모르고 AI 비즈니스를 논할 수는 없다2024.05.23
- 디지털도로에 AI 영상 감지...안양에 KT 자율주행버스 달린다2024.05.27
- 두산디지털이노베이션, AI 사이보보안 포럼 개최2024.05.27
- 라이언로켓, 외신 기자들에 AI 웹툰 제작기 '젠버스' 선보여2024.05.27
한 업계 관계자는 일반 기업이 입찰하는 방식 채택으로 이를 교체해야 한다고 주장했다. 그는 "보통 기업이 업체에 용역을 맡기면 회계 검증 등 불필요한 검토를 하지 않는다"며 "계획대로 용역을 잘 수행하는지, 품질 기준을 잘 충족하는지만 평가한다"고 설명했다.
그는 "공공 사업을 수주하지 않아도 되는 소위 '잘 나가는 기업'은 지나친 서류 검토나 불필요한 형식 절차로 인해 AI 허브 참여를 꺼리고 있다"며 "정책에 변화가 있어야 할 것"이라고 강조했다.