"데이터 라벨링을 딥러닝기반 인공지능(AI)으로 수행하더라도 100% 정확하지 않다. 부정확한 데이터 라벨링은 이후 모델에서 치명적 결과를 초래할 수 있다. AI 학습 데이터 가공에서 사람과 AI가 협업해야 정확해질 수 있다."
AI 학습데이터 가공 플랫폼 전문업체 에이모의 남기철 CSO는 11일 열린 '대한민국 4차산업혁명 페스티벌 2021' 컨퍼런스에서 이같이 말했다.
남기철 CSO는 "올해 들어 자율주행차, 미디어 커머스, OCR 등 데이터 가공 규모가 급격히 증가하고 있다"며 "수많은 데이터를 사람과 AI가 얼마나 잘 협업하면서 라벨링 정확도를 높일 수 있는가가 데이터 라벨링 사업 기업의 이슈"라고 설명했다.
그는 "불행히도 AI가 사람을 대신해 데이터 라벨링을 해주더라도 100% 완벽하지 않으며, 딥러닝 모델의 정확도 개선은 1년에 1% 정도에 불과하다"며 "인력 투입을 줄이기 위해 AI를 도입하더라도 AI도 완전하지 못하다는 뜻"이라고 강조했다.
에이모는 이를 위해 사람과 AI가 협업해 데이터 라벨링 작업을 정확하게 수행할 수 있는 플랫폼을 제공한다.
에이모는 데이터 라벨링 프로세스에 액티브 러닝을 적용해 AI의 부족한 부분을 사람이 채울 수 있는 전반적 흐름을 구축했다.
남 CSO는 "보통 AI로 객체를 인식할 때 예외사항을 얼마나 감지할 수 있냐가 어려운데, 다양한 상황 속에서 판단하기 모호한 사례가 많이 발생한다"며 "이를 AI로 바로 대처하지 못해서 사람이 대처하는 게 더 빠를 수 있다"고 말했다.
그는 "디텍션은 AI가 사람보다 뛰어나서 정확한 데이터를 AI로 작업해 사람에게 전달해줘도 사람이 최종 검수단계에서 틀리다고 판단하면 프로세스 전반이 실패하는 것"이라며 "작업 가이드라인의 일관성을 어떻게 유지할 지 전반적인 연구 방향과 솔루션에서 보완돼야 한다"고 덧붙였다.
에이모의 솔루션을 이용하면, 고객사가 원본 데이터를 올릴 때 플랫폼에서 AI로 데이터를 스크린하고, 이후 데이터의 난이도를 판단하고 얼마나 많은 작업자를 배정할 지 AI가 결정한다.
남 CSO는 "AI가 프로젝트 설계부터 도와주기 시작해서 이후 적합한 인력을 투입해 라벨링을 시작하면 여기서 만들어지는 데이터가 실시간으로 모델에 바로 학습된다"며 "학습된 데이터 모델이 반대로 사람의 검수 작업 시 더 정확한 모델을 제안하기도 한다"고 설명했다.
에이모는 데이터 라벨링을 기업고객사에서 직접 수행할 수 있도록 엔터프라이즈 버전을 출시할 계획이다. 이를 위해 최근 베타 버전을 공개했다.
남 CSO는 "에이모는 더많은 데이터 가공을 위한 선행연구를 하고 있다"며 "로보틱스, AR, VR, 공간인식, 헬스케어 등의 데이터를 선행연구하면서 분야별로 필요한 라벨링 솔루션과 정확성을 높여가고 있다"고 강조했다.