딥네츄럴(대표 박상원, 박정수)은 3분기부터 약 700만건 데이터 가공을 진행한다고 13일 밝혔다.
이번 3분기부터 딥네츄럴은 국가 대규모 학습데이터 구축사업인 'NIA 학습용 데이터 구축 사업'에서 총 4개 부문 사업(스마트 항만, 방송 요약, 일상생활 영상데이터, 숫자발화)의 데이터 구축을 진행한다. 또 NIPA AI 바우처 사업과 K-DATA 데이터바우처 사업 등 국가나 개인 및 기업 차원의 학습데이터 구축 프로젝트와 함께 금융, IT, 교육, 자연어처리 분야 등지에서 다양한 데이터 가공을 실시한다.
딥네츄럴은 2019년부터 데이터 전문 가공 서비스 'DeepNatural AI' 와 11만 회원이 활동하고 있는 크라우드소싱 플랫폼 '레이블러'를 운영 중에 있다. 회사는 또 올해 인공지능 자연어처리 분야에서 화제가 된 한국어 자연어 이해 평가 데이터셋 'KLUE' 프로젝트 데이터 가공 참여로 주목받은 바 있다. 이런 경험을 토대로 딥네츄럴은 불특정 다수의 인력 및 지식을 활용하는 크라우드소싱과 내부 AI 비서 '프라이데이'를 조화롭게 활용해 빠르고 정확한 데이터 구축에 힘쓰고 있다.
일반적으로 대규모 인공지능 데이터 가공에는 플랫폼의 역량뿐만 아니라 다양한 크라우드소싱 작업자의 참여와 이들이 안정적으로 작업할 수 있는 가이드 및 플랫폼이 필수적이다. 이번 700만건 데이터 가공에 대비하여 딥네츄럴에서는 '레이블러' 플랫폼을 통한 데이터 라벨러 모집이 이번 주부터 대규모로 진행될 예정이다. 초보 라벨러도 혼선 없이 안정적으로 작업할 수 있는 작업 가이드 및 플랫폼 환경 보완이 대거 이뤄질 계획이다.
관련기사
- 이투스교육, AI로 나한테 맞는 강좌 추천해준다2021.06.30
- 램브란트의 대표작, AI 기술로 되살렸다2021.06.25
- ‘사람 중심의 AI’…SK텔레콤, 사규에 반영한다2021.05.13
- 에이모, '스마트테크 코리아' 참가…AI 데이터 가공 기술 소개2021.06.22
박상원 딥네츄럴 대표는 "딥네츄럴은 대규모 데이터를 처리할 수 있는 충분한 역량을 갖고 있다"며 “2019년부터 진행해 온 다양한 국가 데이터 댐 정책 산하 사업과 국립국어원 '모두의 말뭉치' 사업 구축 경험, 그리고 기업과 연구 프로젝트에 대한 다양한 경험을 토대로 불특정 다수의 지성을 한데 모으는 크라우드소싱과 '오토 레이블링'으로 불리우는 AI 기술이 가장 잘 조화되는 '시너지 플랫폼'을 갖춘 것이 딥네츄럴의 최대 장점”이라고 밝혔다.
딥네츄럴은 크라우드소싱 플랫폼 레이블러를 기반으로 한 다양한 프로젝트 운영 경험과 이번 3분기부터 진행하는 약 700만 건의 데이터 구축 건을 기반으로, AI 고품질 학습 데이터를 확보하는데 드는 비용과 시간을 감소시킬 수 있는 효과적인 데이터 파이프라인 구축을 지속해나간다는 방침이다.