에이전틱 인공지능(AI) 시대가 왔습니다. AI는 사람 지시 없이 스스로 판단하고 행동하는 자율적 기술로 진화하고 있습니다. 그 핵심에는 데이터가 있습니다. 데이터 수준이 곧 에이전틱 AI 성능을 결정하기 때문입니다. 지디넷코리아는 이번 [SW키트 스페셜] 기획을 위해 미국의 데이터 관리 기업 데이터브릭스와 스노우플레이크, 디노도를 방문했습니다. 각 기업이 어떻게 데이터 품질을 확보하고, 어떤 전략으로 경쟁력을 높이고 있는지 조명합니다. [편집자주]
"인공지능(AI)이 정확히 작동하려면 데이터와 분리돼선 안 됩니다. AI와 데이터는 한 몸으로 움직여야 합니다. 데이터가 외부로 이동하지 않아야 AI의 속도와 정확성, 보안을 동시에 잡을 수 있습니다."
바리스 굴테킨 스노우플레이크 AI 총괄은 미국 캘리포니아주 멘로파크 오피스에서 지디넷코리아를 만나 이동 없는 데이터 구조가 AI 품질을 좌우한다고 재차 강조했다.
스노우플레이크는 데이터를 저장·분석하는 '데이터 클라우드 플랫폼'을 운영하고 있다.
기업은 이 플랫폼으로 여러 부서와 조직에 흩어진 데이터를 한 번에 관리하거나 AI 애플리케이션을 개발할 수 있다.
굴테킨 총괄은 스노우플레이크에서 AI 부문을 이끄는 책임자다. 데이터 클라우드 플랫폼과 코텍스 개발을 주도해 왔다. 스노우플레이크에 합류하기 전에는 구글에서 음성인식과 머신러닝 관련 프로젝트를 이끌었다.
굴테킨 총괄은 데이터 클라우드 플랫폼 특장점으로 높은 보안과 관리 단순화를 꼽았다. 개발자가 데이터를 플랫폼 외부로 옮기지 않아도 AI를 사용할 수 있도록 지원한다는 이유에서다. 그는 "한 플랫폼에서 AI와 데이터가 통합 관리된다"며 "복잡한 시스템 연결도 필요 없다"고 강조했다.
굴테킨 총괄은 최근 해당 플랫폼을 한층 강화했다고 밝혔다. 그는 "AI 모델을 데이터와 동일한 환경에서 실행하는 기능을 한층 강화했다"며 "이에 보안과 효율을 동시에 확보한 '통합 데이터·AI 플랫폼' 전략에 집중하고 있다"고 설명했다.
그는 플랫폼 내 데이터 거버넌스와 접근 권한도 통합 관리된다는 점을 강조했다. 그는 "사용자가 데이터를 어떻게 활용하든 기업 보안 정책과 권한 구조가 그대로 유지된다"며 "AI 분석이나 애플리케이션 실행 과정에서도 데이터가 외부로 이동하지 않아 보안 위험이 근본적으로 차단된다"고 말했다.
이어 "기업은 우리 플랫폼 내에서 데이터 생성부터 저장, 활용까지 한 번에 처리할 수 있다"며 "더 빠르고 효율적으로 AI 관련 업무를 수행할 수 있다"고 덧붙였다.
"에이전틱 AI 시대도 통합 데이터 관리는 핵심"
굴테킨 총괄은 에이전틱 AI 시대에도 통합 데이터·거버넌스로 경쟁력을 강화할 것이라고 밝혔다. 그는 "기업이 단일 환경에서 안전하게 AI 애플리케이션을 구축·운영할 수 있도록 서비스를 더 간소화할 것"이라고 기술 전략을 언급했다.
최근 스노우플레이크는 데이터 수집부터 활용까지 전 과정을 아우르는 '엔터프라이즈 레이크하우스'와 AI 애플리케이션 개발 도구 시리즈를 공개했다. 데이터 사일로를 해소하고 벤더 종속 없는 통합 거버넌스를 구현하려는 기업 전략과 일맥상통한다.
엔터프라이즈 레이크하우스 핵심은 '호라이즌 카탈로그(Horizon Catalog)'와 '오픈플로우(OpenFlow)'다. 호라이즌 카탈로그는 아파치 아이스버그 기반의 오픈 API를 통합해 외부 엔진에서도 데이터를 안전하게 조회·관리할 수 있게 돕는다. 오픈플로우는 오라클과 협력해 준실시간 스트리밍 변경 데이터 캡처(CDC) 기능을 제공하며, 다양한 데이터 소스를 자동으로 통합하고 최신 상태로 유지한다.
관련기사
- [르포] "韓 스타트업, 美서 사업하라"…스노우플레이크 'AI 허브' 가보니2025.11.11
- [인터뷰] 데이터브릭스 AI 총괄 "AI 개발보다 품질 평가 무게 둬야"2025.11.10
- [SW키트] 에이전틱 AI 시대 개발자는 코드를 어떻게 관리할까2025.11.03
- [SW키트] "말 한마디면 끝"…美 빅테크, AI와 대화로 일하는 시대 열다2025.10.24
AI 애플리케이션 개발 도구 시리즈에서는 '코텍스 코드(Cortex Code)'와 '코텍스 AISQL'이 새롭게 추가됐다. 해당 도구는 자연어 명령과 단순 SQL 쿼리만으로 AI 추론 파이프라인을 구축할 수 있도록 돕는다. 여기에 'AI 리댁트(AI Redact)' 기능이 비정형 데이터 내 민감 정보를 자동 탐지·삭제해 프라이버시가 보장된 학습 환경을 제공한다.
굴테킨 총괄은 "우리는 단일 데이터 플랫폼으로 기업에게 더 빠르고 안전하게 AI 혁신을 실현할 수 있는 환경을 지원할 것"이라고 강조했다.











