생성형 AI, 인간-데이터 '통역사' 역할 맡다

[AIxSW] ⑩ '디노도 플랫폼'서 SQL 언어 자연어로 변형

컴퓨팅입력 :2023/11/07 13:57    수정: 2023/11/08 10:13

인공지능(AI)이 연구실을 넘어 산업에 스며들기 시작했습니다. AI는 전사적자원관리(ERP), 고객관계관리(CRM), 인적자본관리(HR), 문서 오피스 등 기업용 소프트웨어(SW)에 들어섰습니다. AI는 여기서 SW 성능을 끌어올려 인력 비용을 줄이고 생산성을 올렸습니다. [SWxAI]는 기업용 SW에 들어간 AI 역할과 강점을 취재해 보도합니다. [편집자주]


기업 디지털전환 핵심은 데이터다. 기업이 데이터를 잘 활용, 관리해야 업무 시스템 운영과 제품 출시를 원활히 할 수 있다. 데이터 관리 솔루션 시장이 점점 커지고 있는 이유다. 

최근 기업 데이터가 방대해지면서 이를 원활히 관리하기 어려워졌다. 이리저리 흩어진 데이터를 한군데 모아 통합 관리할 수 있는 '데이터 가상화'가 주목받는 이유다. 데이터 가상화란 클라우드나 온프레미스 등에 있는 데이터를 가상 공간에 모아 접근, 활용하는 방식이다. 

(사진=이미지투데이)

데이터를 물리적 저장소에 복제하지 않아도 실시간으로 데이터를 통합해 활용할 수 있다. 사용자가 원본 데이터에 접근하지 않아도되므로 보안 면에서도 유리하다.

다만 데이터 가상화 플랫폼을 잘 다루려면 데이터 관련 지식은 필수다. 이를 지속적으로 관리해야 하며 꾸준한 데이터 분석도 진행해야 한다. 인간과 데이터 사이 원활한 상호작용이 이뤄져야 한다.  

생성형 AI, SQL를 자연어로 번역

데이터 가상화 시스템을 운영하는 디노도는 최근 '디노도 플랫폼 9.0' 업데이트로 인간과 데이터 간 상호작용을 높였다. 플랫폼 내 생성형 AI를 탑재해서다. 생성형 AI는 디노도 플랫폼에서 사용자와 데이터 간 의사소통을 원활히 제공하는 역할을 한다. 

디노도는 새 버전에 오픈AI 거대언어모델(LLM) GPT를 탑재했다. 사용자는 전문 지식이 아닌 자연어를 통해 데이터 가상화 플랫폼을 다룰 수 있다. 자연어로 원하는 데이터를 요청하거나 관리를 간편하게 할 수 있다. 

디노도 플랫폼 구조. (사진=디노도 홈페이지)

디노도 플랫폼 내 탑재된 AI는 프로그래밍 언어 SQL를 자연어로 변형할 수 있다. 반대로 자연어를 SQL로 바꿔 플랫폼에 전송할 수 있는 기능을 갖췄다.

예를 들어, 사용자가 "지난 분기 기업 실적에 대한 정보를 줘"라고 입력하면, GPT는 이를 프로그래밍 언어 SQL로 바꿔서 플랫폼에 전달한다. 플랫폼은 이를 실시간으로 분석해 답을 SQL 형태로 내놓는다. GPT는 이를 다시 자연어로 변환해 사용자에게 전달한다. 생성형 AI가 데이터 사용자와 플랫폼 간 '통역사' 역할을 하는 셈이다.

그동안 사용자는 플랫폼에서 데이터 쿼리를 진행할 때 SQL 형식으로만 입력해야 했다. 데이터 관리에 대한 전문적 지식이 필수인 셈이다.

디노도 측은 "실무자가 데이터를 찾으려고 할 때, SQL 언어나 BI 도구에 접근할 필요 없이 자연어만으로 데이터 민주화를 실현한다"며 "이번 챗GPT 및 애저 오픈AI 서비스가 통합으로 데이터 사용자는 디노도 플랫폼에서 관리하고 제공하는 모든 데이터셋에 자연어로 접근할 수 있다"고 설명했다.

디노도는 셀프서비스 제품 개발 역량도 강화했다고 밝혔다. 각 사업부서가 기업 내외부와 협업하고 데이터를 공유하기 위한 기능이다. 데이터 사용자는 드래그 앤 드롭 방식의 '뷰 생성 마법사'와 '임베디드 SQL 쉘'로 디노도 데이터 카탈로그에서 데이터셋을 직접 작성하고 공유할 수 있다.

데이터 액세스를 요청하는 워크플로우 관리도 데이터 카탈로그에서 실행할 수 있다. 데이터 소유자는 액세스 요청에 신속히 대응하고 민감한 데이터 사용 여부를 쉽게 파악할 수 있다. 

클라우드 비용 절감 등 효율성 높여 

디노도 플랫폼 9.0은 '핀옵스 대시보드'로 클라우드 비용 절감을 도울 수 있다. 사용자는 이 대시보드로 온프레미스 및 클라우드에서 사용 중인 다양한 데이터베이스, 데이터 레이크, 데이터 플랫폼들이 소모하는 컴퓨팅 및 데이터 입출력 비용을 관리할 수 있다. 디노도 플랫폼이 제공하는 핀옵스 대시보드는 분석 및 운영 데이터 워크로드에서 발생하는 비용에 대한 현황과 보고서를 제공한다.

관련기사

(사진=디노도)

디노도 측은 데이터양 증가로 데이터 처리 워크로드의 성능과 비용을 최적화해 빅데이터 분석의 민주화를 실현하고 시스템 확장의 비용효율성을 개선할 수 있다는 입장이다. 오픈소스 쿼리 엔진인 프레스토 기반의 대규모 병렬처리 기능을 탑재해 대용량 데이터 처리 성능을 올렸다고 강조했다. 이 기능은 데이터 카탈로그 및 생성형 AI와 같이 현업 실무자의 데이터 활용을 개선하는 기능과 결합돼 SQL 및 고급 분석에 대한 지식 없이도 빅데이터를 분석할 수 있도록 지원한다.

디노도 알베르토 팬 수석부사장 겸 최고기술책임자는 "많은 기업이 데이터 공유 및 분석, 생성형 AI 등 여러 기능을 포함한 프로젝트를 앞다퉈 추진하고 있는 가운데, 효율성 향상, 기존 자산의 수익화, 리스크 감소, 데이터 분석 개선을 위해 데이터 메시나 데이터 패브릭 등 분산형 데이터 관리 체계를 채택하고 있다"며 "이번 발표한 디노도 플랫폼 업데이트는 기업이 데이터 보안 강화와 함께 AI를 활용한 셀프서비스 개선, 핀옵스 기반의 비즈니스 성과 및 수익 개선과 같은 이점을 누릴 수 있도록 지원한다"고 전했다.