세계적으로 인공지능(AI) 개발 경쟁이 뜨거운 가운데 합성데이터가 주목받고 있다. 합성데이터는 가상데이터다. 데이터가 생명인 AI 개발 시간과 비용을 크게 줄일 수 있다. 결과를 보다 빠르고 정확히 분석할 수 있는 장점도 있다.
2019년 10월 설립된 씨앤에이아이 (CN AI, 대표 이원섭)는 합성데이터 전문기업이다. 이 분야에서 가장 많은 특허를 국내서 보유하고 있다. 회사이름 CN은 코드 뉴(Code New)라는 뜻이다. 새로운 코드로 새 패러다임을 열겠다는 의지를 담았다.
22일 서울 성수동 사무실에서 만난 이원섭 대표는 “씨앤에이아이는 AI합성데이터를 국내에서 가장 잘 만드는 회사"라며 "AI가 필요로 하는 수천억 개의 고품질 데이터를 구축해 의료·금융·교육기관 등을 중심으로 공급해 시장을 선도하겠다"고 강조했다.
합성데이터 시장은 국내외에서 계속 커지고 있다. 시장조사기관에 따르면 세계 합성데이터 시장은 최근 몇년간 연평균 22.5% 성장했다. 오는 2024년에는 261억 달러(약 31조원) 규모로 성장할 전망이다. 국내 시장 규모도 가파르게 늘고 있다. 2018년 약 1629억원에서 연평균 9.4% 상승, 오는 2024년 5750억원을 형성할 것으로 예측됐다. 이런 성장세에 편승, 국내서는 네이버와 LG 등 일부 대기업을 중심으로 합성데이터 프로젝트가 진행되고 있다.
삼성전자 소프트웨어(SW) 엔지니어 출신인 이 대표가 보는 합성데이터 핵심 기술은 크게 5가지다. 이미지 합성 데이터 합성 기술을 비롯해 ▲머신러닝 학습 데이터 증대 기술 ▲합성 데이터 탐지 기술 ▲데이터 비식별화 기술 ▲시계열 데이터 합성 기술 등이다. 이 중 빠르게 성장하고 있는 분야가 이미지 데이터 합성 기술이다. 아쉽게도 국내는 아직 이 분야가 취약하다. 씨앤에이아이는 이 부분을 창업 포인트로 삼았다.
이 대표는 "합성데이터 기술은 국내서 우리가 가장 앞서 있다고 자부한다"면서 "합성데이터와 관련한 데이터 생성 특허를 국내서 가장 많은 24개 출원했다"고 밝혔다. 이어 "고품질 빅데이터를 확보하는 건 AI전문 기업 뿐 아니라 AI를 활용해 경쟁력을 높이려는 각 산업(도메인)군에도 화두로 등장했다"고 덧붙였다.
씨앤에이아이는 합성데이터가 미래 기업의 경쟁력을 좌우하는 핵심 수단이 될 것으로 보고 있다. 합성데이터를 이용하면 AI 개발 기간을 파격적으로 단축할 뿐 아니라 천문학적인 비용을 들이지 않고도 그에 준하는 결과를 얻을 수 있기 때문이다.
■삼성 출신 엔지니어들이 다수···짧은 기간에 AI엔진 개발
합성데이터 시장을 개척하고 있는 씨앤에이아이는 '맨파워'도 우수하다. 35명의 전문가 중 대기업 출신이 30%, 전문 엔지니어 비중이 70%다. 이 대표를 포함한 삼성전자 출신 엔지니어들이 의기투합해 만들었고 다수의 삼성 출신 엔지니어들이 회사내에서 근무하고 있다. 이 대표는 “국내 톱5 이공계 대학(원)를 졸업한 직원 비율이 70% 이상”이라며 “양질의 이미지 및 영상 데이터를 생성하는 AI 엔진을 짧은 기간에 개발한 이유"라고 설명했다.
'지휘자'인 이 대표는 미국 인디아나대학교 경제학 학사와 카이스트(KAIST) 기술경영 석사 출신이다. 첫 직장인 삼성전자에서 메모리사업부 SW엔지니어로 일하다 창업에 뛰어들었다. 김보형 최고기술임원(CTO)은 고려대 컴퓨터공학과를 나와 서울대 컴퓨터공학 대학원을 졸업했다. 이 대표와 함께 삼성전자 메모리사업부 SW개발팀에서 일했다. 또 삼성 SDS 전략마케팅팀 컨설팅팀 출신인 이희용 최고운영임원(COO)과 헤지펀드를 거쳐 SK바이오사이언스 신사업개발실에서 근무한 강민성 CSO가 리더그룹을 형성하고 있다.
■합성데이터 기술 활용한 플랫폼 하반기 선보여···합성AI 휴먼서비스도 5월 출시
씨앤에이아이는 올 하반기 시장을 놀라게 할 '깜짝 제품'을 준비중이다. 데이터 생성과 정제, 가공 역량 및 이를 활용한 AI 이미지 영상 처리를 할 수 있는 베타 버전 플랫폼을 선보일 예정이다. 이 플랫폼은 합성데이터 기술을 활용해 다양한 영상을 모아 놓은 일종의 ‘데이터 웨어하우스’다. 데이터를 원하는 AI기업이나 각 도메인 기업이 가져다 쓸 수 있다. 이미 지난해 말 객체복원(Inpainting) 분야에서 데이터를 테스트한 결과 우수한 성과를 얻었다. 앞으로 의료, 금융, 교육 등 다량의 데이터가 필요한 사업군에 공급해 AI 대중화에 기여할 계획이다.
오는 5월에는 휴먼서비스 제품도 선보인다. 기업들이 AI 휴먼을 손쉽게 만들 수 있는 플랫폼이다. 기존 업체들과 달리 ‘실존 인물'이 아닌 '가상의 인물'로 생성할 수 있다는 것이 특징이다. 최근 NH농협은행이 정규직원으로 채용한 가상의 AI행원에도 씨앤에이아이의 기술이 적용됐다.
회사는 앞으로 메디컬 분야에도 진출해 위암과 병리학(Pathology) 분야의 합성데이터 및 AI 제품을 출시할 예정이다. 이 대표는 “위암 데이터는 아무나 만들 수 있다. 하지만 이 데이터가 실제 위암 진단율을 높이는 것은 별개 문제"라며 "우리가 만든 위암 진단용 AI 제품은 이미 병원에서 높은 진단율을 보였다"고 밝혔다. 이어 "합성데이터를 만들려면 이슈가 많다. 합성데이터가 실제 환경의 분포를 맞출 수 있도록 하는 도메인 적응화(Domain Adaptation) 와 다양한 환경에 적응할 수 있게 하는 도메인 무작위화(Domain Randomization) 등의 기술이 필요하다"면서 "우리는 이들 기술 모두 우수하다"고 덧붙였다. 씨앤에이는 합성 데이터 품질을 높이기 위한 압축은 물론 복원 기술과 해상도를 높이는 기술도 보유하고 있다.
■인정받은 기술력···45억원 투자유치
미국에서는 합성데이터 전문기업에 대한 투자와 인수가 잇따르고 있다. 합성데이터 기반 비디오, 이미지 생성 플랫폼을 보유한 ‘에이아이 레베리(AI. Reverie)’가 대표적이다. 이 회사는 지난해 9월 메타플랫폼(구 페이스북)에 인수됐다. 또 합성데이터 전문기업 캐퍼(Caper)도 지난해 인스터카르트(Instacart)에 3억5000만달러에 인수됐고, 토닉에이아이(Tonic.ai)는 시리즈B로 4500만 달러를 투자 유치했다.
관련기사
- [AI기업] 매스프레소 "2~3년내 세계 톱10 에듀 기업 도약"2022.01.18
- [AI기업] 어반베이스 "홈퍼니싱 산업 패러다임 바꿀 것"2021.11.16
- 가격 너무 올렸나...삼성 폴더블폰 판매 저조, 왜?2024.09.06
- 독점 기업 '구글'…美 법무부, 내년 8월 전 처벌 결정2024.09.08
씨앤에이아이는 지난 2년여간 대기업 및 일부 대형 병원과 프로젝트를 하면서 내공을 높여왔다. 이 대표는 “기술력을 인정받아 삼성SDS와 주요 의료 기업, 대학병원과 합성데이터 관련 계약을 체결하고 사업을 진행했다”며 “시드와 프리A 단계를 거치며 45억원 정도의 누적투자도 유치했다”고 밝혔다.
기술력과 함께 기업문화도 이 회사가 자랑하는 부분이다. 이 대표 등이 삼성전자의 조직 문화 전담 조직인 '체인지 에이전트(CA)'에 간여, 조직문화 중요성을 누구보다 잘 알고 있다. 실제 씨앤에이아이도 삼성전자처럼 '직원 소원수리'가 목적인 CA맨을 선임, 운영하고 있다. 씨앤에이아이는 직원들이 가격에 상관없이 점심과 커피를 자유롭게 즐길 수 있다. 또 창의력 증진을 위해 근무시간에도 미술과 댄싱, 음악 같은 취미 활동을 할 수 있다. 씨앤에이아이 회의실에는 직원이 취미활동으로 그린 그림이 걸려있기도 하다. 삼성전자 다닐 때 부사장 스텝으로 있으며 조직문화가 기업에 중대한 영향을 미친다는 걸 몸소 깨달았다는 이 대표는 "팀원들이 자아실현과 행복을 맛볼 수 있게 일하기 좋은 문화를 만드는데 최선을 다하겠다"고 말했다.