생성AI 잘 쓰는 기업의 공통점은…"방향성·데이터 민주화"

[디노 2024] 강형준 데이터브릭스코리아 지사장

컴퓨팅입력 :2024/10/10 14:43

생성 인공지능(AI)을 비즈니스에 접목해 의미 있는 성과를 내고 있는 기업은 먼저 전략에 맞는 데이터를 수집하고, 이를 구성원들이 손쉽게 적극 활용할 수 있는 '데이터 민주화' 체제를 구축해 운영하고 있다는 분석이 나왔다.

강형준 데이터브릭스코리아 지사장은 10일 과학기술정보통신부 주최, 한국소프트웨어산업협회(KOSA) 주관, 지디넷코리아 후원으로 개최된 ‘디지털 혁신 페스타 2024’ 부대 행사로 진행된 ‘SaaS 서밋’에서 이같이 밝혔다.

데이터브릭스는 ‘데이터 레이크하우스’라는 개념을 주창한 데이터 관리 전문 기업이다. 데이터 레이크하우스는 종류를 막론한 데이터를 수집하면서도 이에 대한 분석, 인텔리전스를 지원하는 데이터 관리 아키텍처로, 데이터 품질에 따라 성능이 좌우되는 AI 기반 데이터 인프라로 활용되고 있다. 

회사는 글로벌 주요 기업들을 고객사로 두고 있고 국내에서도 LG전자, 크래프톤, 지마켓, 하이퍼커넥트, 한화 등 대기업 다수와 협력 중이다.

강형준 지사장은 “작년 말 이후로 기업들의 데이터와 AI 활용 방향성에 많은 변화가 나타났다”며 “우리만의 대규모 언어 모델을 만들어야 한다는 입장에서, 사업 및 방향성에 부합하는 다양한 언어 모델들을 빠르게 접목하고, 필요한 데이터를 통합해 맞는 답을 얻어내고자 전략적 투자를 하고 있다”고 진단했다.

강형준 데이터브릭스코리아 지사장

데이터브릭스 고객사 중 이런 방법론에 따라 AI를 성공적으로 활용 중인 사례들도 소개했다.

미국 여행사 제트블루는 불편사항 등 고객 서비스에서 얻어지는 모든 데이터를 활용한 자연어 검색 기반 고객 서비스를 구축해 높은 만족도를 기록하고 있다.

금융 소프트웨어 기업 인투이트의 경우 효율적인 대출 서비스를 위해 고객사별 평가, 개인화 서비스를 구축하는 데 AI를 활용, 대출 지원 속도를 높였다.

미국 통신사 AT&T도 무선 가입자 2억명, 1천500만 가구 가입자 데이터를 화용해 보이스 피싱 등 다양한 사기 피해를 최소화하는 데 AI를 활용했다. 강 지사장은 “가입자 정보 같은 건 외부 플랫폼에 제공할 수 없는 데이터인데, 대규모언어모델(LLM)을 우리 인텔리전스 플랫폼 안으로 유입했다”며 “여기서 도출되는 효과적이고 제대로 된 지표를 토대로 예지보전 관련 데이터를 현업 부서와 콜센터에 제공했다”고 설명했다.

강 지사장은 최근 기업간거래(B2B), 기업대소비자(B2C) 등 사업 종류를 막론하고 기업들은 이처럼 효과적인 생성AI 접목 방안을 탐색하고 있다고 언급했다. 그러나 기업이 이 과정에서 적절한 데이터를 모으지 못하거나, 데이터를 모으더라도 이를 적절하게 활용할 만한 여건이 갖춰지지 않아 시행착오를 겪고 있다는 분석이다.

강 지사장은 “한국 기업들은 특히 ‘내 것’을 꺼내놓길 좋아하질 않는데, 데이터로 유효한 분석을 하기 위해선 상당하고 다양한 데이터를 모아야 한다”며 “기술도 중요하지만, 무엇보다 사람과 프로세스를 바꾸기 위한 리더십이 중요하다”고 조언했다.

강형준 데이터브릭스코리아 지사장

가령 머신러닝 프로젝트를 추진하더라도 부서별로 업무가 진행돼 필요한 협업이 이뤄지지 않거나, 기술적 문제점 또는 정치적 역학관계로 데이터 통합이 이뤄지지 않는 사례들이 나타났다는 것이다.

강 지사장은 “각 모델로 존재하는 데이터셋을 통합하는 거버넌스와 이를 관리하는 기술이 중요하고, 여기에 데이터 프라이버시를 준수할 수 있는 접근 제어 관리가 중요하다”고 했다.

데이터 민주화의 중요성도 역설했다. 강 지사장은 “생성AI뿐 아니라 모든 데이터 업무에선 특정 기술셋을 보유한 인력에 대한 의존도가 높아 데이터 민주화를 확보하는 데 큰 고충을 겪고 한다”며 “이렇게 되면 구성원들이 이런 인력들에 필요한 사항을 요청해야 하고, 선순환 과정이 길어질 수밖에 없기 때문에 모두가 접근할 수 있는 플랫폼을 구축하는 것이 보다 효율적인 방식”이라고 지적했다.

관련기사

특정 언어에 기반한 플랫폼에 국한되는 것이 아닌, 비IT 인력도 목적에 따른 데이터 분석 및 AI 활용이 가능하는 데 있어 자연어 검색 기능이 필수적이라고도 강조했다.

강 지사장은 “과거에는 프로젝트 수행에 6개월 이상의 긴 시간이 소요됐지만, 요즘에는 소규모 PoC는 2~3일 내로도 가능하게 될 정도로 기술이 발달했다”며 “얼마나 효율적으로 최신 기술을 시스템에 녹여낼 수 있는지가 기업 경쟁력이 되는 현재, 특정 LLM에 종속되기보다 다양한 것을 체험하고, 생성AI를 정확히 활용해야 진정한 엔터프라이즈 AI의 시작점이 될 것”이라고 말했다.