오승택 에이모 대표 "인공지능의 탄약을 만든다"

컴퓨팅입력 :2020/07/23 15:04

“머신러닝의 여러 방법 중 상용화에 근접한 건 ‘슈퍼바이저드 러닝’이다. 머신을 공부시키는 데이터를 머신이 만들기도 하지만, 일단 사람이 먼저 만들어줘야 한다. 모델을 만들어 학습시키고, 이전 결과의 오류값을 재수정해서 다시 학습시키는 액티브 러닝의 순환고리를 갖고 있어야 하는데, 사람의 뇌와 눈으로 인지한 사물의 형상을 기계가 읽을 수 있는 데이터로 만들어주는 게 중요하다. 에이모는 머신러닝의 학습 데이터를 만드는 탄약과 그 플랫폼을 가진 회사다.”

오승택 에이모 대표는 최근 기자와 만나 자신의 회사를 이같이 설명했다.

에이모는 머신러닝에 필요한 고품질의 학습 데이터를 ‘스마트 데이터’로 정의하고, 인공지능(AI)을 계속 성장시킬 수 있는 스마트 데이터 플랫폼을 개발하고 있다. 사명이 곧 플랫폼의 명칭으로 ‘에이모(AIMMO)’다.

오승택 에이모 대표

최근 한국판 뉴딜 사업의 발표로 세간의 주목을 받고 있는 데이터 라벨링 분야가 에이모와 관련된다. 일반적으로 이미지, 텍스트 등을 인식하는 식별 인공지능은 물체를 인지하고 그에 맞는 객체값을 매긴 텍스트를 만들어낸다. 여러 사진 속에서 고양이나 개를 찾아내거나, 그 수를 샌다. 이같은 데이터 값을 이미지 같은 파일에 매칭시키는 것을 ‘데이터 라벨링’이라 한다.

아직 학습을 하지 않은 식별 알고리즘의 첫 결과는 100% 완벽하지 않다. 이후 값을 정확하게 수정하는 검토 작업을 거치고, 완벽해진 데이터를 다시 알고리즘에 학습시킴으로써, 알고리즘의 정확도를 성장시키게 된다. 데이터 라벨링의 품질이 높을수록 데이터 양이 적더라도 알고리즘 성장 속도를 가속할 수 있다. 이런 검증, 검수 작업을 사람의 손으로 직접하는게 초반의 데이터 라벨링이었다.

오승택 대표는 “데이터를 학습하고, 재학습하는 순환고리 과정을 자동화하는 플랫폼이 에이모”라며 “사람이 인식한 정보를 휴먼인텔리전스 데이터라고 하면, 그를 가공해서 머신에 넣어 이해시키고, 다시 오류값을 가공해 재학습시키는 일련의 과정이 에이모의 ‘AI 어시스트’란 AI로 자동화된다”고 설명했다.

그는 “데이터 가공이라 하면, 사람을 모아놓고 데이터를 분류하는 작업으로 이해하기도 하는데 그는 잘못된 이해”라며 “기계가 읽을 수 있도록 데이터 분류 작업을 플랫폼으로 수행하는, 사람과AI가 협업하는 플랫폼 구조를 통해 자동 라벨링하는 모델이 필요하다”고 강조했다.

에이모 어노테이션 예시

에이모는 AI 모델의 목적과 데이터 특성을 고려하여 머신러닝 모델링에 필요한 학습 데이터를 가공하기 위한 프로젝트를 설계하고 학습데이터 가공과 검수로 정확도를 보장하는 서비스를 제공한다. 이는 GTaaS(Ground Truth as a Service)라 불린다. 에이모 서비스는 다양한 학습 데이터 가공에 필요한 주석도구(Annotation Tool)와 템플릿을 보유했으며, 어노테이션 작업에 참여하는 작업자/검수자를 관리하는 매니지먼트 시스템, 작업과 검수를 쉽고 빠르게 할 수 있는 AI 어시스트 기능 등을 제공한다.

또, 에이모 플랫폼을 이용해 고객이 직접 보유한 데이터 라벨링 작업을 할 수 있는 제품도 내놓을 예정이다. 현재 비공개베타(CBT) 테스트 중인 ‘에이모 엔터프라이즈’다. 퍼블릭 클라우드 환경에서 활용하는 에디션과, 사내 구축 인프라에 설치해 활용하는 온프레미스 에디션으로 제공될 예정이다.

에이모의 기술적 장점은 정확성이다. 다양한 작업 도구를 지원하면서 학습 데이터를 빠르고 정확하게 라벨링할 수 있다. 이미지 데이터 가공을 위한 단순분류, 폴리곤, 바운딩박스, 랜드마크 등의 작업을 빠르게 수행할 수 있다. 영상 혹은 연속된 이미지 내 동일 객체에 추적하고 식별하는 작업도 가능하다. 에이모가 제공하는 오브젝트 트래킹(Object Tracking) 기능은 객체를 화면에 분류하고 식별, 추적하는 것뿐만 아니라 객체가 화면에서 사라진 후 다시 등장했을 때에도 다시 인식할 수 있도록 딥러닝 기술을 도입해 학습 데이터 가공을 쉽게 할 수 있도록 지원한다.

오디오 데이터 가공을 위한 STT, TTS, 음성 분류 등도 가능하다. 또한 자율주행차량 모델 개발에 필요한 학습 데이터 영역도 강점을 갖고 있다. 자율주행 차량의 라이다(LiDAR), 레이더, 카메라 등에서 수집된 다양한 데이터를 통합해 자율주행 차량이 이동 객체(차량, 보행자 등)와 고정 객체(차선, 신호등, 주변 환경 등) 등을 식별할 수 있는 학습 데이터를 만든다.

에이모 3D LiDAR 데이터 가공 예시

자율주행 차량에 부착된 라이다(LiDAR)로 수집된 360도 포인트 클라우드 데이터를 2D 카메라 이미지를 참조해 객체의 크기, 위치, 방향 등을 어노테이션 할 수 있도록 센서 퓨전 방식의 어노테이션 툴을 개발했다. 이는 자율주행용 학습 데이터를 웹 브라우저 기반으로 편리하게 작업할 수 있어 관련 업계의 호평을 받고 있다.

오 대표는 “자율주행 차량의 여러 센서를 한번에 다룰 수 있는 기술력은 확보하기 매우 어렵다”며 “라이다 센서부터 2D 카메라 이미지까지 이를 잘 정리하고 정확한 결과를 보증해야 하는데, 이런 숙련된 플랫폼을 가진 회사는 에이모 외에 거의 없다”고 강조했다.

그는 “액티브 러닝과 자동 라벨링은 미래에 핵심 역량이 될 것”이라며 “디지털 뉴딜로 학습데이터 관련 시장에 많은 신규 회사가 등장하겠지만, 에이모가 쌓아온 4년이란 공부의 경험은 쉽게 따라오기 힘들 것”이라고 말했다.

그는 “예를 들어 라벨링 작업 정의를 하면 MS 워드 문서로 몇천단어가 되는데, 데이터모델러가 자기 모델에 맞는 데이터를 규정한 것에 맞추는 작업이 간단하지 않다”며 “플랫폼과 인력이 함께 가야 데이터 품질이 결정되는 영역”이라고 덧붙였다.

오승택 대표는 CJ 제일제당 E-Biz 사업본부장과 다음커뮤니케이션 E커머스본부장을 역임했던 인물이다.

그는 다음 E커머스본부장으로 근무하면서 쇼핑몰 방문자의 활동을 실시간으로 추적해 구매를 예측하는 아이디어를 생각해냈다. 2016년 ‘블로웨일’이란 회사를 창업한 후 소비자 분석 알고리즘을 만들던 중 AI 개발을 지원하는 데이터 플랫폼으로 사업을 전격적으로 전환했다. 창업 8개월 만의 결정이었다.

현재까지 오 대표의 선택은 적절했다. 에이모는 경기도자율주행센터, 차세대융합기술연구원, 현대자동차, 현대모비스 등 국내 주요 기관과 기업에 자율주행 프로젝트를 위한 AI 학습데이터를 제공하고 있다. 최근 한국국토정보공사 공간정보연구원 주관 ‘자율주행 인공지능 인식기술 활성화를 위한 융합 DB 서비스 구축’ 사업을 수행하고 있다. 

관련기사

이 사업은 국가중점 데이터 개방지원 사업의 일환으로 기획돼 자율주행 기술 실용화에 필요한 다양한 종류의 인식기술 개발을 지원하고 관련 산업을 활성화하기 위해 추진된다. 미디어그룹 사람과 숲이 총괄하고 에이모, 유원지리정보시스템, 지티원, 피앤티컨설팅이 컨소시엄으로 참여한다. 도로주행 영상데이터, 3D 거리데이터, 디지털 공간정보 등 기존 데이터를 자율주행 인식기술 개발을 위한 AI 학습데이터, 융합데이터로 가공하여 공공에 공개함으로써 관련 산업의 신규 진입장벽을 낮추고 데이터기반 활용 분야 확산을 적극 유도하겠다는 전략이다.

오 대표는 “지금은 디지털 트랜스포메이션이지만, 실제 4차 산업 혁명으로 다가가고 있다고 생각한다”며 “안정적으로 성과를 내면서 기술의 깊이가 있는 회사로 만들어 가고 싶다”고 포부를 밝혔다.