[현장] 데이터브릭스, 한국서 3년 연속 100% 성장…"플랫폼 대체 불가"

전문인력 1만명 양성·비즈니스 성장 100% 목표 제시…신제품 3종 국내 출시도

컴퓨팅입력 :2026/04/01 15:28    수정: 2026/04/01 15:31

한국 진출 4년 차를 맞은 데이터브릭스가 지난 3년간 매년 100% 이상 비즈니스 성장을 이어온 가운데, 전문 인력 1만명 양성 계획과 국내 신제품을 공개하며 한국 시장 공략에 속도를 낸다. 

강형준 데이터브릭스코리아 지사장은 1일 서울 강남구 그랜드 인터컨티넨탈 파르나스에서 열린 'AI 데이즈' 기자간담회에서 "한국 시장은 고객 실사용량을 기반으로 매년 100% 이상 성장해 왔다"며 이같이 밝혔다.

데이터브릭스의 매출 지표는 달러 데이터브릭스유닛(DBU) 기준으로 선제적 계약이 아닌 고객이 실제 사용한 만큼을 매출로 산정하는 방식이다. 회사의 글로벌 연간반복매출(ARR)은 54억 달러, 기업가치는 1000억 달러 이상으로 평가받는데 글로벌 연간 성장률 65% 이상을 웃도는 수준이 한국에서 지속되고 있다는 설명이다.

강형준 데이터브릭스코리아 지사장이 1일 서울 강남구 그랜드 인터컨티넨탈 파르나스에서 열린 'AI 데이즈' 기자간담회에서 발표하고 있다. (사진=지디넷코리아)

강 지사장은 한국 시장의 고성장 배경으로 "탄탄한 디지털 인프라를 바탕으로 한 기술 준비성과 엔터프라이즈 전반으로 빠르게 확산하는 기업용 AI 도입 속도, 글로벌 AI 3위 강국을 목표로 한 정부의 정책 지원이 주효했다"고 제시했다.

데이터브릭스는 향후 3년 내 국내 전문 인력 1만명 이상 양성을 목표로 한국어 공인 트레이너를 공식 채용해 온라인 일반 과정과 기업 맞춤형 트레이닝을 병행 운영 중이다. 국내 공인 파트너사 40개 이상이 마이그레이션·최적화 등 실제 프로젝트를 수행하며 생태계를 뒷받침하고 있다. 시스템통합(SI)·프로페셔널 서비스는 직접 수행하지 않고 파트너사를 통해 이뤄지는 구조다. 강 지사장은 "전문 인력 양성과 파트너 생태계 확장을 함께 키우는 것이 지향점"이라고 말했다.

데이터브릭스는 스노우플레이크 등 경쟁사 대비 AI·머신러닝(ML) 분야 경험이 업계 최상위 수준이라는 점을 차별화 근거로 꼽았다. 아파치스파크와 ML플로우 창시자들이 비정형·정형 데이터 모두를 오픈 포맷 기반으로 처리하는 데서 회사가 출발한 만큼, 데이터 처리·AI 모델링 전반에 걸친 기술력 경험이 압도적이란 이유에서다. 

기업 고객이 최신 파운데이션 모델을 데이터브릭스 플랫폼 안에서 직접 구동하는 구조로, 오픈AI·구글·앤트로픽 등 외부 모델로의 데이터 유출 우려를 원천 차단할 수 있다는 점도 강점으로 내세웠다. 조성현 데이터브릭스코리아 기술총괄은 "기업이 자체적으로 바이브코딩 환경을 구축할 경우 거대언어모델(LLM) 토큰 사용량 통제나 데이터 외부 유출 방지 등 거버넌스 문제가 반드시 따라온다"고 설명했다.

조성현 데이터브릭스코리아 기술총괄이 1일 서울 강남구 그랜드 인터컨티넨탈 파르나스에서 열린 'AI 데이즈' 기자간담회에서 발표하고 있다. (사진=지디넷코리아)

조 총괄은 올해 국내 정식 서비스를 시작하는 제품 세 가지도 소개했다. 운영 데이터베이스와 분석을 통합한 '레이크베이스'는 오는 5월 국내 배포 예정이다. 포스트그레SQL 기반 오픈 기술로 설계됐으며 컴퓨팅과 스토리지를 완전 분리해 요청 시 1초 이내 기동이 가능하다. 에이전트 히스토리·개인화 데이터 저장에 최적화돼 AI 에이전트 앱 인프라로 주목받고 있다. 자연어 데이터 분석 기능 '지니'와 개발자용 자율 에이전트 '지니코드', 에이전트 구축·평가·최적화 플랫폼 '에이전트브릭스'는 올해 1분기 국내 배포를 완료했다.

최근 AI가 서비스형소프트웨어(SaaS) 시장을 잠식할 것이란 '사스포칼립스' 공포가 업계 전반에 확산됐지만, 데이터브릭스는 직접적인 영향권 밖이라고 일축했다. 세일즈포스 같은 SaaS 기업이 아니라 AI 레디 데이터 기반의 데이터 처리·저장 인프라를 제공하는 플랫폼 기업인 만큼 동일 선상에서 볼 수 없다는 입장이다. 강 지사장은 "클로드코드로 자체 AI를 구축하더라도 데이터브릭스 플랫폼을 대체할 수는 없다"고 자신했다.

관련기사

실제로 데이터브릭스의 자연어 코드 생성 기능 지니코드는 백엔드가 앤트로픽의 클로드코드 기반으로 구현됐다. 경쟁 관계로 비칠 수 있는 AI 코딩 도구를 플랫폼 안에 통합해 활용하는 방식으로, 대체가 아닌 연동·흡수의 관점에서 접근한다는 의미다. 조 총괄은 "고객이 원하면 커서나 클로드코드 등 외부 환경에서 데이터브릭스와 인터페이스하는 가이드를 제공하고 사용자인터페이스(UI) 내 개발은 지니코드로 안내하고 있다"고 부연했다.

데이터브릭스코리아는 올해도 한국 시장에서 글로벌 평균을 웃도는 성장세를 이어갈 것으로 전망한다. 신제품 3종의 국내 출시와 인재 양성 생태계 구축이 맞물리면서 성장 모멘텀이 가속할 것이란 판단이다. 강 지사장은 "한국은 글로벌 성장률을 상회하는 시장"이라며 "올해도 최소 100% 이상 성장을 목표로 적극적인 투자를 이어가겠다"고 피력했다.