배스트데이터 "AI 경쟁력, 학습 아닌 추론 중심 데이터 구조가 결정한다"

[ACC 2025] AI OS·DASE 아키텍처 전략 공개…실시간 데이터 활용 체계 제시

컴퓨팅입력 :2025/12/11 16:15

"기업이 그래픽처리장치(GPU) 구축에 막대한 비용을 투입해도 인공지능(AI) 학습에만 활용해서는 실제 성과와 연결되지 않습니다. 앞으로의 경쟁력은 추론 중심 데이터 활용 구조를 얼마나 빨리 갖추느냐에 달려 있습니다."

배스트데이터 송성환 이사는 11일 서울 중구 신라호텔에서 열린 'AI & 클라우드 컨퍼런스 2025(ACC 2025)'에서 AI 시대 데이터 플랫폼의 중요성에 대해 이같이 밝혔다.

송 이사는 올해 AI 시장 변화의 핵심 키워드를 추론 확장으로 규정했다. 또 최근 GPU 세대 교체 주기가 빨라지고 모델링 개발 속도가 비약적으로 높아지는 가운데 기업들이 여전히 학습 중심 사고방식에 갇혀 있다고 지적했다.

배스트데이터 송성환 이사 (사진=한정호 기자)

그는 "데이터 활용성이 뒷받침되지 않으면 AI 투자 대비 기업 생산성은 올라가지 않는다"며 실시간 서비스와 맞닿은 AI 데이터 파이프라인의 중요성을 강조했다.

특히 AI 활용을 위한 데이터 파이프라인을 입수·가공·저장이 아닌 사용자·에이전트가 즉시 활용할 수 있는 마지막 액션 단계까지 이어지는 구조로 재정의해야 한다고 주장했다. 샘플링 데이터나 가공 데이터로 학습을 수행하는 것을 넘어 고객 요청에 대한 즉각적 응답성과 실시간 추론이 핵심이라는 설명이다.

송 이사는 이같은 요구를 해결하기 위한 배스트데이터의 'AI 운영체제(OS)' 전략을 소개했다. 배스트데이터는 창립 초기 스토리지 기업으로 출발해 현재는 데이터 수집부터 변환·쿼리·임베딩·검색증강생성(RAG)까지 연결하는 AI 데이터 플랫폼으로 영역을 확장했다.

배스트데이터는 AI OS를 기반으로 어떠한 AI 인프라와 솔루션 환경에서든 투입된 데이터를 자동 변환하고 대형 클라우드 서비스 사업자(CSP) 및 엔비디아가 제공하는 서비스와의 직접 연동과 아웃풋을 창출한다.

배스트데이터 핵심 기술은 독자적으로 개발한 '분리 자원 공유 구조(DASE)' 아키텍처다. DASE는 컨트롤러와 데이터 노드가 완전히 분리된 구조로 기업의 모든 데이터 풀을 공유한다. 이를 통해 장애가 발생해도 운영 영향이 없고 스토리지 컨트롤러·쿼리 엔진·데이터 엔진 등 다양한 역할을 하나의 노드에 유연하게 배치할 수 있도록 지원한다.

이 구조는 최근 글로벌 벤더들이 뒤따라 채택하고 있는 방식이라는 게 송 이사의 설명이다.

배스트데이터 송성환 이사가 AI OS 전략을 발표했다. (사진=한정호 기자)

DASE 위에는 '엘리멘트 스토어'라는 통합 데이터 레이어가 구축돼 있다. 이는 정형·비정형·반정형 데이터를 어떤 프로토콜로 받아도 동일한 방식으로 저장·관리할 수 있도록 설계된 구조다. 투입된 데이터는 자동으로 표준 데이터베이스(DB) 포맷으로 변환할 수 있고 빠른 인덱싱을 위한 카탈로그 기능도 제공해 실시간 데이터 쿼리·분석을 지원한다.

아울러 배스트데이터는 DB 기능을 OS 레벨에서 기본 제공한다. 사용자는 별도 설치 없이 콘솔에서 몇 번의 클릭만으로 스키마와 테이블을 구성할 수 있다. 주요 쿼리 엔진이 내장돼 데이터 이동 없이 데이터 앞쪽에서 직접 연산을 수행할 수 있다.

벡터 네이티브 DB 기능도 포함돼 있어 멀티모달 AI·검색증강생성(RAG)·임베딩 서비스 구축에 필요한 모든 요소를 단일 플랫폼으로 통합했다.

아울러 '싱크엔진', '인사이트엔진', 멀티 콘텍스트 프로토콜(MCP) 오퍼레이터 등도 단일 플랫폼 내에서 서비스한다. 해당 기능들은 외부 솔루션, 내부 스토리지, 로그·이벤트 데이터 등 다양한 소스를 자동 통합하고 여러 AI 모델을 OS 수준에서 연동해 엔드투엔드 AI 파이프라인 자동화를 구현한다.

관련기사

이러한 기술력을 앞세워 글로벌 시장에서 가파른 성장세를 보이고 있다. 배스트데이터는 올해 포브스 'AI 50'에 선정됐으며, 세계 최대 GPU 클라우드 기업 중 하나인 코어위브가 약 2조5천억원 규모의 투자를 단행해 데이터 플랫폼으로 채택했다.

송 이사는 "AI 운영의 성패는 데이터를 얼마나 빠르고 일관되게 활용 가능한 형태로 전환하느냐에 달려 있다"며 "이 전환의 모든 과정을 하나의 데이터 플랫폼 OS로 통합해 기업이 AI 생산성을 극대화할 수 있도록 지원하겠다"고 강조했다.