[AI기업] 씨이랩 "AI용 영상데이터 분석 최고··· 구글보다 10배 빨라"

가상으로 영상 데이터 만드는 기술 보유···국방 등에 적용

컴퓨팅입력 :2020/12/11 10:46

"우리는 인공지능(AI)용 영상(비디오) 데이터를 국내에서 가장 잘 다루는 기업입니다. 물리적으로 힘든 대규모 인공지능(AI) 학습용 영상 데이터를 가상으로 만들 수 있는 기술을 자체 개발했고, 매출까지 올렸습니다. 인공지능(AI) 시대를 맞아 영상 데이터와 영상 데이터 품질이 중요하다고 누구나 이야기지만 우리처럼 방대한 영상 데이터를 직접 다뤄본 경험이 있는 곳은 국내에서 우리가 유일합니다."

정대수 씨이랩 부사장 겸 최고기술책임자(CTO)는 11일 지디넷코리아와의 인터뷰에서 이 같이 강조하며 "우리는 이미 3년전에 1000여대의 CCTV에서 수집한 실시간 대규모 영상 분석 규모의 대용량 영상 데이터를 초고속으로 분석하는 플랫폼을 만들어 국방 분야에 적용한 경험을 갖고 있다"고 말했다.

2011년 설립된 씨이랩은 그동안 쌓아온 빅데이터 전문기술과 경험을 기반으로 영상 AI 분야에서 두각을 보이고 있다. 씨이랩 기술을 인정한 미국 엔비디아(NVIDIA)가 올해 국내 소프트웨어(SW) 기업중 처음으로 씨이랩을 우수파트너로 승격하기도 했다.

정대수 부사장은 씨이랩 기술이 "대부분 AI 기술이 시도하는 알고리즘 튜닝에 의존한 분석 방법이 아니다"면서 "우리가 보유한 AI 기술력을 활용하면 대규모 영상 데이터를 구글의 기계학습 프레임워크인 '텐서플로(Tensorflow)' 보다 10배 이상 빠르게 처리할 수 있다“고 역설했다. 대용량의 고품질 데이터 최적화를 통해 어떤 상황에서도 분석이 가능한 AI 모델을 생성하는 '데이터 중심의 AI(Data-centric AI)'를 추구하고 있다는 것이다. 아래는 정 부사장과의 일문일답. 정 부사장은 씨이랩 공동 창업자다. 설립 이후 지금까지 이우영 대표와 호흡을 맞추고 있다.

정대수 씨이랩 부사장 겸 CTO가 씨이랩이 보유한 AI기술과 솔루션을 설명하고 있다.

-대규모 영상 데이터 분석이 강점이라고 했는데 적용 사례가 있나

"이미 3년전에 국방 분야에 적용했다. 초당 2백만 화소의 이미지가 30장씩 연속적으로 모여 있는 대용량 영상 데이터였다. 양적인 면에서 기존 데이터와 차원이 달랐다. 영상 데이터는 분석 면에서 텍스트나 센서 데이터보다 더 어렵고 고부가 기술이다. 차원이 다르다. 화면을 구성하는 화소(픽셀)의 시간적, 공간적 관계까지 고려해야한다. 당시 우리가 국방 분야에 적용한 시스템의 저장 데이터 규모는 5페타바이트(PB)에 달했다. 1000여대 CCTV의 10개월 분량과 같는 규모였다. 이를 기반으로 클라우드 환경에서 대규모 영상데이터를 분석할 수 있는 플랫폼 '엑스 아이바(X-AIVA)'를 개발했다. 국방은 물론 금융, 유통, 플랜트 등 다양한 분야로 서비스를 확장할 계획이다."

-구글 텐서플로보다 영상 분석이 10배 이상 빠르다고...

"당시 우리가 국방 분야에 공급한 플랫폼 성능은 세계적으로 유명한 AI 프레임워크인 구글 '텐서플로(TensorFlow)'에 비해 영상 데이터 분석 속도가 10배 이상 빨랐다. 대용량-대규모 비디오 데이터 처리에 특화된 기술을 보유했기에 가능했다. 이 기술은 2018년 미국 실리콘벨리에서 열린 'GTC 인공지능 컨퍼런스'에서 발표, 주목을 받았다. 엔비디아가 우리 기술력을 인정해 국내 소프트웨어(SW) 기업 중 처음으로 올해 우수파트너로 승격한 것도 이 때문이다. 이러한 성능 차이는 하드웨어 스펙과 네트워크 속도가 빨라진 지금 더 크다."

-어떤 AI 솔루션과 기술을 갖고 있나

"분산데이터 파이프라인 기반 대용량 영상 데이터 전처리 기술인 'X-댐스(X-DAMS)'가 근간이다. 이를 기반으로 AI 연산처리에 필수자원인 GPU를 효율적으로 관리할 수 있는 솔루션 '우유니(Uyuni)'를 2018년 출시했다. 이어 2019년에는 AI 영상데이터 가공 솔루션 'X-레이블러(X-Labeller)'를, 최근엔 클라우드 기반 초고속 AI 비디오 분석 서비스 'X-아이바(X-AIVA)'를 선보였다."

-씨이랩 근간 기술인 'X댐스'는 어떤 기술인가

" 우리 AI 기술과 서비스는 'X-댐스(X-DAMS)'에서 시작한다. 'X-댐스'는 대용량의 대규모 실시간 영상을 추출해 잘 쌓고 꺼내 쓸 수 있게 하는 역할을 한다. 우리는 이를 데이터 파이프라인이라 부른다. 이렇게 쌓인 데이터는 분석을 위해 AI 분석 모델이 구동되는 GPU 연산처리 과정을 거친다."

-GPU 활용을 극대화 해주는 '우유니'는 어떻게 작동하나

"'우유니'는 볼리비아에 있는 소금사막 이름이다. 담당 개발 팀장이 좋아해 이 이름을 붙였다. 2018년 10월 론칭했다. 반도체 칩에는 CPU와 GPU가 있다. 이중 AI에 적합한 반도체가 GPU다. GPU는 CPU와 특징이 다르다. CPU는 문서 작업을 하면서 음악도 듣을 수 있는 등 다중 작업이 가능하다. 전문 용어로 멀티 프로세스, 멀티 쓰레딩이라고 한다. GPU는 그렇지 않다. 멀티 프로세스가 안된다. 원래 그렇게 만들어졌다. 보통 능숙한 개발자는 트릭을 써 이걸 커버한다. 즉, 하나의 GPU에 프로세스를 몇 개 더 올리는 것이다. 하지만 아무리 뛰어난 개발자라도 수백개, 수천개를 올릴(관리) 수 없다. 그래서 우리는 이를 자동화했다. 가상화와 오케스트레이션 기술을 사용해 유휴 GPU가 알아서 데이터를 처리한다. GPU 중 놀고 있는 부분을 찾아 병렬 처리(로드 밸런싱)를 해준다. 프로세스 건강 상태도 체크할 수 있다. 사용자 입장에서는 GPU 활용을 극대화할 수 있는 것이다. '우유니'는 고가의 GPU 자원을 잘 활용해 빠르게 AI 학습을 시켜준다. 우리와 같은 접근을 하는 회사가 몇 개 있지만 씨이랩이 국내 최초로 상용화에 성공했다. 현재 시장 점유율이 1위다. 이 기술로 엔비디아의 우수파트너에 올해 승격됐다."

-최근 선보인  'X-아이바'는 어디에 특화됐나. 특히 과거 CCTV 영상 데이터를 분석하는데 효과가 있다는데

"대용량의 비디오 데이터를 초고속으로 분석해주는 서비스가 'X-아이바'다.  CCTV 데이터 분석을 현재 데이터는 물론 과거 데이터를 분석하는데도 효과가 탁월하다. 과거 CCT 영상 데이터가 많이 쌓여 있는데 'X-아이바'는 이들 데이터를 기존보다 10배 이상 빨리 분석해준다. 저장 데이터를 분석할 수 있다고 다들 말 하지만 우리처럼 실제 해 본 곳은 드물다. 이게 되려면 파이프라인이라고 불리는 데이터 전체에 대한 지식과 대용량 데이터를 처리하는 병렬 및 분산 기술 등 AI 전반에 대한 기술이 필요하다. 현재 'X-아이바'는 금융권에서 적용을 검토하고 있다."

-AI용 학습 데이터를 가상으로 만드는 기술을 갖고 있다고 하던데 어떤 기술인가

"AI 분석으로 유의미한 결과를 얻으려면 학습 데이터가 최소 수만에서 수십만장이 필요하다. 특히 엔터프라즈 시장에서 상용으로 쓰려면 영상 데이터를 최소 백만장 이상 학습시켜야 한다. 하지만 어떤 분야는 이처럼 막대한 영상 데이터를 구하기 힘들다. 국방 같은 데가 그렇다.  국방의 어떤 분야는 확보 가능한 학습 데이터가 수십장에 불과하다. 그래서 우리는 3D 그래픽으로 가상의 데이터를 만들어 AI 학습에 적용시켰다. 이런 기술력을 상용화한 AI 기업은 씨이랩이 유일하다. 국방과학연구소에서 기술 이전을 받아 이미 기술력도 검증 받았다."

-가상으로 만든 영상 데이터 품질은 괜찮나

"분석 목적에 정확하게 맞아 떨어지는 실사 학습데이터가 있다면 당연히 실사 학습데이터의 효율을 따라갈 수 없다. 하지만 분석 환경과 상황 전체를 커버할 수 있는 실사 학습데이터를 구하는 것이 거의 불가능할 때는 가상 학습데이터의 효과가 두드러진다. 가상 학습데이터를 활용할 경우 특정 상황에서는 오히려 더 나은 결과를 만들어 내기도 한다. 우리가 만드는 가상데이터는 3D 모델을 기반으로 무수히 많은 상황을 전제로 생성한다. 객체가 다른 사물에 가려지거나 촬영 각도가 달라지더라도 인식을 잘 한다."

정대수 부사장. 씨이랩 창립멤버로 CTO도 맡고 있다.

-가상 학습 데이터를 만드는데 시간은 얼마나 걸리나. 사람과 비교하면

"사용자가 분석 목적에 따라 가상 환경 설정을 하고 나면 자동으로 3만장의 AI학습용 가상 영상 데이터를 만드는데 1시간이면 충분하다. 이 정도 규모의 학습데이터를 사람이 수작업으로 만든다면 원천 영상이 있다고 해도 적어도 몇 주의 시간이 필요하다. 가상으로 영상 데이터를 만드는데 필요한 기술은 여러 가지가 혼합된다. 주로 사용하는 기술은 대립 생성망 모델(GAN, Generative Adversarial Networks)과 도메인 적응화(Domain Adaptation), 도메인 무작위화(Domain Randomization) 등이다. 이들 방법을 분석 목적에 따라 혼합해 사용한다."

-데이터를 적게 쓰는 AI가 요즘 화두인데...

"딥러닝 약점은 대량의 학습 데이터가 필요하다는 거다. 이를 극복하려는 다양한 시도가 있지만 아직은 연구 수준의 사례에 그치고 있다. 데이터를 적게 쓰는 AI는 이전의 컴퓨팅(알고리즘) 방법과 맥을 같이 한다. 전통적 컴퓨터 비전이나 알고리즘은 데이터를 적게 쓴다. 데이터 특성(피처, Feature)을 엣지(Edge)로 한정해 추출하고, 그 추출한 피처를 해석하는 수학적 모델링을 도출하는 게 알고리즘이다. 딥러닝은 이러한 피처 엔지니어링(피처를 추출 및 가공하는 것)을 사람이 아닌 모델이 자동으로 하는 거다. 연구자(사람)의 수고를 모델이 하는 대신 막대한 양의 학습데이터가 필요하다. 딥러닝의 약점이자 장점이다."

관련기사

-씨이랩이 지향하는 '데이터 중심 AI(Data-centric AI) 회사’는 무슨 뜻인가

"많은 AI 솔루션 기업은 알고리즘 튜닝(피처엔지니어링과 이를 위한 파라미터 튜닝)에 의존한다. 이는 전통적 머신러닝이다. 딥러닝의 답이 될 수 없다. 딥러닝의 성능을 높이기 위한 핵심 키는 데이터다. AI 머신러닝 대표주자로 딥러닝이 자리잡으면서 학습 데이터의 중요성이 부각되었고, 정부 시책 등을 통해 양적인 면에서는 해결 방안이 어느 정도 추진되고 있다. 이제는 학습 데이터의 양적인 부분이 해소 됐을때 어떤 효과가 있을 지, 또 기대한 효과가 안 나오면 왜 그런지를 진지하게 고민할 때다.  양적 이점을 잘 활용하려면 질이 뒷받침 돼야 한다. 씨이랩 기술은 충분한 양의 데이터에 대한 질적인 면을 비디오 데이터 관점에서 해결해준다. 씨이랩은 대용량 비디오 데이터를 평가해 양질의 데이터를 가려내고 또 양질의 데이터를 직접 생산해 낸다. 우리가 말하는 '데이터 중심 AI'의 핵심이다."