생성형 AI 도입이 빠르게 확산되고 있지만, 기업 현장에서는 기대만큼 성과를 내지 못하는 사례가 늘고 있다. 이와 관련해 지능형 데이터 플랫폼 전문기업 데이터스트림즈(대표 이영상)는 AI 활용의 성패를 가르는 핵심 요소로 ‘AI-Ready Data’를 제시하며 시장 적용을 확대하고 있다.
28일, 데이터스트림즈에 따르면 현재 기업 AI 프로젝트의 상당수는 데이터 불일치, 출처 불명확, 최신성 부족 등 기초 데이터 문제로 인해 실제 활용 단계에서 한계를 드러내고 있다. 특히 최근 확산하는 ‘에이전트 AI(Agentic AI)’는 단순 질의응답을 넘어 판단과 실행까지 수행하는 구조로 발전하면서 AI가 활용하는 데이터의 정합성과 신뢰성 확보가 핵심 경쟁 요소로 부상했다.
데이터스트림즈는 이러한 환경에서 요구하는 데이터 상태를 'AI가 바로 활용할 수 있도록 정제·연결·통제된 데이터', 즉 AI-Ready Data로 정의했다. 'AI-Ready Data' 구현을 위해서는 기존과 같은 데이터 저장·통합 중심 접근을 넘어 데이터의 흐름과 의미, 품질을 통합적으로 관리하는 구조가 필요하다.
이에 데이터스트림즈는 데이터 가상화 기반 통합 접근과 메타데이터 중심 거버넌스를 결합한 데이터 패브릭(Data Fabric) 아키텍처를 기반으로 AI-Ready Data를 구현하고 있다.
이 구조는 연결, 의미, 통제 등 크게 세가지로 구성됐다. 즉, ▲연결(Connectivity)은 분산된 데이터를 물리적 이동 없이 실시간으로 연결해 데이터 사일로를 제거하고 통합 접근 환경을 구현)해주고 ▲의미(Semantics)는 메타데이터 기반으로 데이터의 비즈니스 의미와 관계를 정의해 AI가 동일한 기준으로 데이터를 이해하도록 지원하며 ▲통제(Governance)는 데이터 계보(Lineage)와 품질 규칙을 기반으로 데이터 흐름과 상태를 지속적으로 관리해 AI 입력 데이터의 신뢰성을 확보해준다.
데이터스트림즈는 가상화 엔진 '슈퍼 쿼리(SuperQuery)와 메타데이터 플랫폼 메타스트림(MetaStream)을 기반으로 이러한 구조를 구현했다. 특히 이 구조에서는 AI가 사용하는 모든 데이터에 대해 출처, 변환 과정, 품질 상태를 추적할 수 있어 AI 결과의 설명 가능성(Explainability)까지 확보할 수 있다. 이러한 전략은 최근 한국지능정보사회진흥원 세미나 등에서도 공유됐고, 에이전트 AI 시대 데이터 인프라 방향으로 논의되고 있다고 회사는 설명했다.
관련기사
- 데이터스트림즈 "AI한계 데이터 아케텍처와 거버넌스로 해결"2026.03.28
- 데이터스트림즈, 한국도로공사 내부 LLM 고도화2026.02.09
- 전 세계 첫 구글 AI 캠퍼스, 한국에 문 연다…딥마인드와 'K-문샷' 추진2026.04.27
- "K-AI칩, 시스템 실증 단계 진입…생태계 전반 자생력 키워야"2026.04.27
데이터스트림즈는 현재 금융권 중앙회, 공공기관, 대형 서비스 기업 등을 중심으로 AI-Ready Data 기반 데이터 거버넌스 체계 적용을 확대하고 있다. 이영상 데이터스트림즈 대표는 “AI가 기대만큼 성과를 내지 못하는 이유는 대부분 데이터가 준비돼 있지 않기 때문”이라며 “AI 경쟁력은 모델이 아니라 AI-Ready Data를 얼마나 빠르게 구축하느냐에서 결정될 것”이라고 말했다.
한편 데이터스트림즈는 향후 AI-Ready Data 전략을 중심으로 에이전트 AI 시대에 대응하는 데이터 인프라 사업을 확대해 나갈 계획이다.











