딥네츄럴, 700만건 데이터 가공 진행

NIA 인공지능 학습데이터 4개 사업 선정...데이터 라벨러 대거 모집

중기/스타트업입력 :2021/07/13 09:51

딥네츄럴(대표 박상원, 박정수)은 3분기부터 약 700만건 데이터 가공을 진행한다고 13일 밝혔다.

이번 3분기부터 딥네츄럴은 국가 대규모 학습데이터 구축사업인 'NIA 학습용 데이터 구축 사업'에서 총 4개 부문 사업(스마트 항만, 방송 요약, 일상생활 영상데이터, 숫자발화)의 데이터 구축을 진행한다. 또 NIPA AI 바우처 사업과 K-DATA 데이터바우처 사업 등 국가나 개인 및 기업 차원의 학습데이터 구축 프로젝트와 함께 금융, IT, 교육, 자연어처리 분야 등지에서 다양한 데이터 가공을 실시한다.

딥네츄럴은 2019년부터 데이터 전문 가공 서비스 'DeepNatural AI' 와 11만 회원이 활동하고 있는 크라우드소싱 플랫폼 '레이블러'를 운영 중에 있다. 회사는 또 올해 인공지능 자연어처리 분야에서 화제가 된 한국어 자연어 이해 평가 데이터셋 'KLUE' 프로젝트 데이터 가공 참여로 주목받은 바 있다. 이런 경험을 토대로 딥네츄럴은 불특정 다수의 인력 및 지식을 활용하는 크라우드소싱과 내부 AI 비서 '프라이데이'를 조화롭게 활용해 빠르고 정확한 데이터 구축에 힘쓰고 있다.

딥네츄럴

일반적으로 대규모 인공지능 데이터 가공에는 플랫폼의 역량뿐만 아니라 다양한 크라우드소싱 작업자의 참여와 이들이 안정적으로 작업할 수 있는 가이드 및 플랫폼이 필수적이다. 이번 700만건 데이터 가공에 대비하여 딥네츄럴에서는 '레이블러' 플랫폼을 통한 데이터 라벨러 모집이 이번 주부터 대규모로 진행될 예정이다. 초보 라벨러도 혼선 없이 안정적으로 작업할 수 있는 작업 가이드 및 플랫폼 환경 보완이 대거 이뤄질 계획이다.

관련기사

박상원 딥네츄럴 대표는 "딥네츄럴은 대규모 데이터를 처리할 수 있는 충분한 역량을 갖고 있다"며 “2019년부터 진행해 온 다양한 국가 데이터 댐 정책 산하 사업과 국립국어원 '모두의 말뭉치' 사업 구축 경험, 그리고 기업과 연구 프로젝트에 대한 다양한 경험을 토대로 불특정 다수의 지성을 한데 모으는 크라우드소싱과 '오토 레이블링'으로 불리우는 AI 기술이 가장 잘 조화되는 '시너지 플랫폼'을 갖춘 것이 딥네츄럴의 최대 장점”이라고 밝혔다.

딥네츄럴은 크라우드소싱 플랫폼 레이블러를 기반으로 한 다양한 프로젝트 운영 경험과 이번 3분기부터 진행하는 약 700만 건의 데이터 구축 건을 기반으로, AI 고품질 학습 데이터를 확보하는데 드는 비용과 시간을 감소시킬 수 있는 효과적인 데이터 파이프라인 구축을 지속해나간다는 방침이다.