"4년간 쌓은 30만 작업자의 방대한 행동데이터가 경쟁력"

[2021년 데이터품질 대상/유통품질 부문 최우수상/크라우드웍스]

컴퓨팅입력 :2021/12/18 16:11    수정: 2021/12/18 17:36

과기정통부와 한국데이터산업진흥원(K-data, 원장 윤혜정)이 디지털 뉴딜을 확산하고 공공과 민간의 우수한 데이터 품질관리 사례를 발굴하기 위해 시행한 '2021년 데이터 품질대상'에서 크라우드웍스(대표 박민우)가 '유통 품질' 부문 최우수 상을 수상했다.

시상식은 16일 오후 서울 드래곤시티에서 열렸다.

2017년 설립된 크라우드웍스는 인공지능(AI) 학습 데이터 크라우드소싱 플랫폼 기업이다. 현재 31만명이 넘는 크라우드소싱 작업자들과 국내 최대 규모의 데이터 라벨링, 가공, 전처리, 분석 등의 서비스를 제공하고 있다. 2019년부터 3년 연속 K-data가 시행하는 '데이터 바우처 사업'에 참여하고 있다. 본사는 서울 테헤란로에 있고, 120명의 직원이 일하고 있다.

박민우 크라우드웍스 대표는 1998년 첫 번째 창업을 시작으로 현재까지 총 5번의 창업 이력을 갖춘 연쇄 창업가다. 검색엔진 기업이었던 첫 창업 기업을 시작으로 2000년 AI 솔루션 기업을 시작했지만, 당시에는 인프라가 부족해 사업을 접을 수 밖에 없었다. 2016년부터 인공지능에 대한 중요성과 관심이 확대되며 자연스레 인프라가 구축되기 시작했고, 이 인프라를 자유롭게 활용할 수 있는 툴이 고도화됐는데, 이러한 시장 변화에서 AI시대가 열릴 것이라는 확신과 AI기술 핵심은 데이터라고 판단해 크라우드웍스를 창업했다.

윤혜정 한국데이터산업진흥원장이 최우수상을 받은 크라우드웍스 박민우 대표에 상을 주고 있다.

크라우드웍스의 주력 제품은 크라우드소싱을 통한 인공지능 학습데이터 플랫폼이다. 인공지능 기술 고도화에 필요한 고품질 학습 데이터를 수집하고 가공하는 '데이터 라벨링'에 국내 최초로 다수의 대중이 참여하는 크라우드소싱 방식을 도입했다. 박민우 대표는 "이를 통해 크라우드웍스는 기존 대비 3배 이상 데이터 생산성을 제공한다"면서 "우리가 가진 가장 큰 경쟁력은 4년간 쌓은 30만 작업자의 방대한 행동데이터와 140개 이상의 국내외 특허 출원"이라고 밝혔다. 

이어 박 대표는 "데이터 라벨링 서비스는 진입 장벽이 낮아 빠르게 레드오션이 될 수 있는 영역이지만 데이터 라벨러의 행동 패턴을 분석해 인력을 매칭해주는 HR테크 기술을 보유한 곳은 우리 외에 아직 존재하지 않는다"면서 "크라우드웍스는 데이터라벨링 업계 최다 특허 보유라는 타이틀과 함께 기술적 진입장벽을 높이고 있다. 프로젝트 시작부터 종료까지, 회원 가입시점부터 데이터를 어떻게 분리할 건지, 작업자 및 검수자 배치 등 세분화된 분야에 모두 특허가 걸려있다"며 데이터와 특허 중요성을 강조했다.

2019년 이래 크라우드웍스는 3년 연속 데이터바우처 지원사업의 공급기업에 이름을 올렸다. 박 대표는 "데이터가 필요한 수요기업에게 양질의 데이터를 제공하기 위해 데이터 바우처 사업에 참여하게 됐다"면서 "사업 진행 전에는 영업과 세미나 등을 진행했고, 수요기업이 필요한 데이터를 확보하기 위해 컨설팅도 수행했다"고 설명했다. 회사는 사업 진행 과정에서 예측 가능한 위험 요소를 사전에 예방하는 한편 예측 불가한 일이 생겼을 때는 그동안의 노하우를 통해 신속히 해결했다고 밝혔다. 이 같은 노력으로 크라우드웍스는 수요기업이 원하는 데이터를 모두 납기일에 맞춰 제공했고, 감리도 성공적으로 마무리 했다고 덧붙였다.

특히 크라우드웍스는 700건 이상의 프로젝트 수행 경험을 바탕으로 검증된 품질 보증 체계를 구축, 수요기업의 요구를 만족시키고 있다. 수집 및 가공한 데이터 품질 관리를 위해 데이터 속성과 유형별 품질 기준을 수립했고, 4단계로 구성한 인력 검증 시스템을 활용해 작업자와 검수자를 관리, 양질의 데이터 라벨러 운영을 보장한다. 또, 개인정보유출 및 데이터 도용을 방지하기 위한 점검 및 관리에도 힘쓰고 있다.

관련기사

박 대표는 최우수상을 받은 소감을 묻자 "AI 기술 고도화의 핵심이라 할 수 있는 데이터는 그 무엇보다 품질이 중요하다"면서 "이에 따라 크라우드웍스는 정교하고 정확한 데이터를 위한 품질관리와 데이터를 수집 및 가공하는 데이터 라벨러의 전문성 강화를 위해 힘쓰고 있다"고 밝혔다. 이어 "이번에 데이터 유통 품질 부문 최우수상을 받음으로써 이런 부분을 인정받은 것 같아 매우 기쁘다"면서 "앞으로도 더 많은 기업에게 양질의 데이터를 제공하고 성숙한 관리 체계를 운영하며 국내 AI 산업 발전을 이끌어 나가겠다"는 포부를 밝혔다.

데이터 고속도로 등 정부가 추진하는 데이터 강국 정책에 대해서는 "데이터3법 등 관련 법안 통과와 함께 데이터 활용에 대한 사회적 인식 변화가 큰 과제"라며 "데이터의 원활한 이동환경을 조성하기 위해 당국이 보다 힘을 기울여줬으면 한다"고 말했다.