애플이 텍스트와 이미지를 컴퓨터가 이해하고 분석할 수 있는 유용한 데이터로 바꿔 주는 인공지능(AI) 스타트업 래티스데이터를 인수한다. 이 스타트업이 가진 기술은 AI 시스템을 학습시키는데 필요한 데이터를 별다른 사전처리 작업 없이도 쓸 수 있게 한다.
이전까지 AI 시스템에 데이터를 학습시키기 위해서는 해당 데이터를 컴퓨터가 알아들을 수 있도록 바꿔주는 작업이 필요했다. 액셀파일과 같은 형태로 데이터가 기록돼 있어야만 이를 학습할 수 있기 때문이다. 따라서 텍스트, 이미지 등도 사람이 아닌 컴퓨터가 알아들을 수 있는 형태로 가공하기 위해 해당 데이터에 일종의 꼬리표(라벨링)를 붙이는 작업이 추가로 필요했다.
13일(현지시간) 테크크런치 등 외신은 익명 소식통을 인용, 애플이 2주 전, 2억달러에 래티스데이터를 인수했다고 보도했다. 이를 통해 20명 가량 해당 스타트업 엔지니어들이 애플에 합류하게 됐다는 소식이다.
테크크런치에 따르면 애플측은 "때에 따라서 작은 기술 기업을 인수하기는 하지만 우리는 일반적으로 우리의 목적이나 계획에 대해서 언급하지는 않는다"고 답했다.
컴퓨터가 분석하기 어려운 이미지, 텍스트 비정형데이터를 일명 '다크데이터'라고 부른다. 이 스타트업은 컴퓨터가 머신러닝, 딥러닝을 돌리면서 학습하는 과정에 보다 효율적으로 활용하게 하는 것을 목표로 한다.
인터넷으로 연결된 디지털 세상에서 생산되는 데이터는 2013년 기준 4.4제타바이트(약 4.4조 기가바이트)에 달한다. 이후 2020년에는 10배인 44제타바이트(약 44조 기가바이트) 데이터가 만들어질 것으로 예상된다.
빠른 속도로 늘어나고 있는 데이터들 중 상당수는 액셀파일 등으로 정리할 수 있는 정형데이터가 아니라 비정형데이터(다크데이터)이다. 문제는 비정형데이터의 경우 컴퓨터가 이를 분석하고 처리하기가 어렵다는 점이다. 래티스데이터는 머신러닝에 이런 데이터를 더 유용하게 활용할 수 있도록 지원한다.
2015년 창업한 래티스데이터는 미국 스탠포드대 연구팀이 개발한 다크데이터 분석툴인 '딥다이브'를 상용화한 것이다.
관련기사
- 딥러닝 기반 안티바이러스, 어떻게 태어났나2017.05.14
- 카카오 뉴스추천 알고리즘은 어떻게 작동하나2017.05.14
- 심장병 환자 위험도 예측, AI가 의사보다 낫다2017.05.14
- 인텔 "AI 기술 테스트 환경 빌려드립니다"2017.05.14
딥다이브는 이전까지 인신매매 등 국제범죄문제를 해결하려는 시도나 의료연구, 고생물학 연구 등 프로젝트에 활용됐다.
이 회사 공동창업자로 이 스타트업에서 내부 연구를 책임지고 있는 크리스토퍼 리는 스탠포드대 교수는 딥다이브를 고안해 맥아더 지니어스 상을 수상했다. 이 회사 최고경영자(CEO)에서 최고기술책임자(CTO)로 자리를 옮긴 마이클 카팔레라 미시건대 교수는 빅데이터 분산처리시스템으로 유명한 '하둡'의 공동 창업자 중 한 명이기도 하다.