AI를 가르치는 40만 '교사'와 함께 크는 회사

[이균성의 스타트업 스토리]①크라우드웍스

중기/스타트업입력 :2022/11/09 14:28    수정: 2022/11/29 13:50

꿈은 삶의 이정표이자 동력이다. 꿈은 곧 미래의 삶이다. 꿈은 그래서 소중하다. 꿈은 사람마다 다르고 다른 만큼 다채롭다. 스타트업이 꾸는 꿈도 그럴 것이다. 소중하고 다채롭다. ‘이균성의 스타트업 스토리’는 누군가의 꿈 이야기다. 꿈꾸는 사람이 자신의 이야기를 들려주고 다른 꿈꾸는 사람을 소개하는 릴레이 형식으로 진행된다.[편집자주]

AI를 가르치는 40만 '교사'와 함께 크는 회사 '크라우드웍스'

박민우 크라우드웍스 대표의 꿈은 높은 산맥처럼 웅장하지는 않다. 인공지능(AI) 관련 사업을 하지만 ‘알파고’처럼 누구나 알만한 ‘대박 서비스’를 꿈꾸지 않는다. 그 대신에 모든 AI 서비스에 꼭 필요한 일을 찾아 제공하는 데 초점을 맞춘다. 그 점에서 박 대표의 꿈은 쉽사리 무너지지 않을, 잘 지어진 석조건물 같다. 탄탄해 보인다.

박 대표의 꿈은 그러면서도 작은 단독건물로만 머물 것 같지는 않다. AI가 진화할수록 박 대표의 사업은 더 확장될 가능성이 크다. 대부분의 기업과 기관이 AI를 도입하고, AI가 할 수 있는 일이 많아질수록 박 대표의 서비스는 더 많이 쓰일 수밖에 없어 보인다. 그 점에서 박 대표의 꿈은 강처럼 유장하고 바다처럼 광대해질 수 있다.

크라우드웍스의 핵심 사업은 네이버의 인공지능 번역기 ‘파파고’ 같은 AI 서비스의 지능을 높이는 일이다. 그러기 위해서는 데이터를 통해 AI를 지속적으로 학습시켜야 한다. 크라우드웍스는 이를 위해 ‘인공지능 학습용 데이터 셋 제작 플랫폼과 솔루션’을 개발했으며 독특한 방식의 데이터 수집 및 가공 플랫폼을 도입했다.

박민우 크라우드웍스 대표


■왜 데이터를 ‘AI 시대 석유’라 하는 걸까

보통 AI는 ‘알파고’나 ‘파파고’처럼 대중 서비스로만 인식된다. 하지만 보통 사람이 아는 AI 서비스는 사실 복잡한 산업 생태계 속에 존재한다.

사람들은 흔히 데이터를 석유에 빗대어서 말하곤 한다. AI 시대에는 데이터가 산업화 시대의 석유처럼 중요하기 때문이다. 그러나 그게 전부는 아니다. AI 산업 생태계가 석유 산업 생태계와 비슷한 구조로 되어있기 때문이기도 하다.

세상에 흩어져 있는 날 데이터는 원유(原油)와 같다. 소중하지만 아직 쓸모가 없다. 원유가 쓰이기 위해서 정제(精製)돼야 한다. 휘발유나 경유처럼 소비자가 직접 쓸 수 있는 게 정제한 석유다. 석유 제품의 쓰임은 이보다 훨씬 더 많다. 화학기술과 결합하면 플라스틱과 비닐 등 수 천 수 만 가지의 상품을 만들어낼 수도 있다.

크라우드웍스의 비즈니스는 원유를 채굴해 정유(精油)하고 온갖 종류의 석유화학 제품을 만들 수 있도록 가공해주는 역할과 매우 흡사하다. 산업화 시대의 정유 및 석유화학회사처럼 AI 시대의 원유인 데이터를 수집하고 가공해준다.

■데이터는 왜 수집되고 가공되어야 할까

AI는 똑똑하지만 까다롭다. 똑똑하다는 건 아주 제한된 영역에서 인간과 비교될 수 없는 지능을 발휘한다는 사실이다. 까다롭다는 건 그렇게 되기까지 엄청난 양의 데이터를 틀에 정해진 형태로 제공하면서 학습시켜야 한다는 사실이다.

AI 서비스 경쟁은 그 까다로움을 누가 잘 극복해내느냐는 데 달려 있다.

크라우드웍스 내부 회의 장면

크라우드웍스는 AI 서비스 기업들의 이 경쟁에 관여한다. 학습에 까다로운 AI를 누가 더 빠른 속도로 똑똑하게 할지는 결국 데이터의 양(量)과 질(質)에 의해서 결정될 가능성이 큰데 크라우드웍스가 고객 기업에게 이를 도와주는 것이다.

사실 이런 일을 하는 기업이 현재 국내에만 1천 개 정도나 있다고 한다. AI 서비스를 위해 이 일의 불가피성을 입증하는 것이라고 할 수 있다.

1천 개 기업 중 크라우드웍스가 출중한 까닭은 ‘인공지능 학습용 데이터 셋 제작 플랫폼과 솔루션’에 크라우드 방식을 적용했다는 점 때문이다.

■데이터 수집 가공에 크라우드가 빛나는 이유

크라우드(crowd)는 우리말로 군중(群衆)을 의미한다. 크라우드웍스라는 사명도 사실 여기에서 비롯됐다. ‘군중이 일하는 플랫폼’을 뜻한다고 할 수 있다. 이 곳에서 군중이 하는 일은 전문용어로 ‘라벨링(labeling)’이라고 한다. 라벨링은 AI가 학습할 수 있도록 데이터를 모으고 가공해서 넣어주는 일이다. 일하는 방식과 일거리는 해당 AI가 원하는 바에 따라 플랫폼이 알려준다. 군중은 거기 맞춰 작업하면 된다.

크라우드웍스에서는 이 일을 하는 사람을 ‘라베러(labeler)’라 부른다. 현재 크라우드웍스 라벨러는 41만여 명이다. 여기에서 힘이 나온다.

“AI 학습의 관건은 필요한 데이터를 정해진 형태로 얼마나 빨리 제공할 수 있느냐에 달려있죠. 크라우드웍스의 플랫폼은 AI 기업의 이런 고민을 크라우드 방식으로 해결해나고 있다는 게 강점입니다. 회사 설립 이래 지금까지 1천여 개의 AI 프로젝트에 관여했는데 비용은 50% 줄이고 생산성은 3배로 높이는 걸로 나옵니다.”


■라벨러 육성은 ‘사회적 가치’를 키우는 일

박 대표의 비전은 뜻밖에도 ‘사회적 가치’를 키우는 데 있었다. AI와 사람이 서로 도움을 주고받으며 공존하는 플랫폼을 만드는 게 그것이다.

박민우 대표는 크라우드웍스가 AI 회사이면서 사람을 존중하는 HI 회사이기도 하다고 말한다

“엔지니어 출신이어서 기술에 관심이 많았습니다. 그런데 크라우드웍스를 창업하고부터는 사람에 관심이 많아졌습니다. 특히 라벨러에 관심 크죠. 그들이 우리 플랫폼에서 어떻게 일하고, 얼마나 일하고, 왜 일하는 지 등에 주목합니다.”

라벨러는 크게 두 부류로 나뉜다. 본업이 있으면서 부업하는 사람, 본업을 갖지 못한 취업 취약계층. 라벨러에게는 근무와 관련된 어떤 의무도 존재하지 않는다. 본인이 원하는 만큼 일하고 그 결과에 따라 보수를 받을 뿐이다. 다만 저작권 초상권 개인정보 등에 위배된 불법적인 데이터를 건드리면 안 되고, 플랫폼이 제어한다.

“라벨러 중에는 월 400만~500만원을 버는 분도 계십니다. 물론 몇 만원 받는 분도 계시구요. 올해의 경우 연간 100억 원 정도가 라벨러에게 지급될 것 같습니다. 하지만 초기에는 라벨러 사이에 불만도 많았죠. ‘디지털 노가다’라면서요. 그런데 AI 시장이 커지면 커질수록 라벨러의 역할과 보수도 커질 가능성이 있다고 생각합니다.”


■전문 라벨러 육성 교육 과정을 만든 이유

“초기 AI에 제공하는 데이터는 비교적 단순한 겁니다. 라벨링이 어렵지 않은 것이죠. 자신이 관심 있는 영역에서는 누구나 할 수 있다고 보면 됩니다. 그런데 AI가 진화하면서 라벨링도 조금씩 고도화하고 있어요. 전문성이 요구 되죠.”

크라우드웍스는 그래서 ‘크라우드 아카데미’라는 이름으로 전문 라벨러 육성 서비스도 제공한다. 현재까지 10만여 명이 이 과정을 수료했다.

“이 과정을 거치면 저희 AI 프로젝트에서 라벨링 할 우선권을 드리죠. 조금 고도화된 라벨링을 잘 할 수 있다고 우리가 입증한 분들이니까요.”


■라벨링은 AI 교육이고 라벨러는 AI 교사다

라벨러는 본래 상표 따위를 찍는 기계를 가리키는데, 크라우드웍스의 라벨러는 AI 시대에 깊은 철학적 문제를 제기한다. 라벨링은 본질적으로 AI를 가르치는 일이고, 라벨러는 그 가르치는 일을 하는 사람인데, 보통 사람의 단편적인 정보가 파파고 같은 AI를 가르치는 교육이 된다는 사실은 시사하는 바가 크다.

그 사실이 인간과 AI의 공존을 도모할 하나의 포인트가 될 수 있다.

이 글의 제목에서 라벨러를 굳이 교사로 표기한 이유이기도 하다. 따지고 보면 배움이란 꼭 위대한 스승한테서만 얻는 게 아니지 않겠는가. 배워야 하고 배울 것은 도처에 있다. AI도 그러하고 진정으로 배우려는 사람 또한 그러할 거다.


■박민우 대표는 국내 AI 산업의 초창기 전문가

크라우드웍스는 박 대표가 다섯 번째로 창업한 기업이다. 그의 첫 직장은 현대그룹 시스템통합(SI) 계열사였던 현대정보기술의 연구소다. 1998년 기업용 검색엔진 솔루션 회사를 창업했다가 LAS21과 합병했고, 2000년에는 AI솔루션 회사인 메타와이스를 창업했다. 이 회사도 2006년에는 DIG커뮤니케이션과 합병했다.

크라우드웍스 사내 라운지

그가 AI산업 생태계에 대한 이해도가 높고, AI 분야에서 탄탄하면서도 확장 가능성이 큰 비즈니스 모델을 발굴해 창업한 데는 과거의 경험이 토대가 되었다.

창립 5년째인 크라우드웍스는 지난해 매출이 85억 원이고, 올해는 120억 원이 예상된다. 지금까지는 연평균 95%의 성장률을 기록하고 있고, 올해부터 수년간은 50% 안팎의 성장률을 보일 것으로 예상되는 상황이다. 올해까지는 연구개발비를 투자하느라 적자지만, 박 대표는 내년에는 손익분기점을 넘길 것으로 예상한다.

지금까지 세 차례에 걸쳐 총 317억 원을 투자 받았으며, 회계심사와 기술평가를 통과한 상황으로, 내년 중 ‘특례 상장’을 준비하고 있다.


■“과거엔 돈이 문제였는데, 지금은 사람이 가장 어렵습니다.”

여러 번 창업한 일이 있고, 그 과정이 순탄치 만은 않았을 것이며, 그래서 기업 하는 일의 어려움이 무엇이냐고 물었더니 이러한 대답이 돌아왔다. 왜 그렇고, 어떻게 해결하느냐는 질문에 대한 그의 답은 모두 다 새겨들을 만 하다.

“CEO인 제 생각과 모든 직원의 생각이 다 같을 순 없는 거잖아요. 다르다는 게 가장 어렵습니다. 저는 그래서 가능하면 직원과 1대 1 만남을 자주 갖고, 말하기보다 들으려합니다. 무엇이 어떻게 다른지를 아는 게 무엇보다 중요하니까요. 말하기보다 듣기를 하니까, 자연스럽게 지시할 것보다 도와줘야 할 것들이 많아지더군요.”

한 길로 나아가는 조직을 이루는 일은 꼭 같은 사람과만 할 수는 없는 것이고 결국 다른 사람과 함께 해야 하는 고된 작업이다. 다른 사람의 다름을 제대로 이해할 때야 비로소 서로 다르면서도 같은 길을 갈 수 있다는 이치를 말하는 것이다.

그 방법이 크라우드웍스 법인을 넘어 41만 라벨러와 함께 AI와 사람의 생태계를 지속가능하게 확장하는 길이라고 박 대표는 믿고 있는 것이다.


관련기사

덧붙이는 말씀

박민우 대표가 소개한 ‘이균성의 스타트업 스토리’ 다음 대상은 코딩 교육 1위 기업 엘리스의 김재원 대표입니다. 그 분의 꿈은 어떤 색깔일까요. 벌써부터 궁금합니다.