아직 갈길 먼 AI 도입, 가장 큰 과제는 '데이터'

AI 도입 앞서 체계적인 데이터베이스 구축 및 관리 우선해야

컴퓨팅입력 :2024/04/15 15:08

글로벌 빅테크를 중심으로 생성형AI 기술이 하루가 다르게 급격한 발전을 이루고 있다. 하지만 아직 상당수의 기업들은 AI를 도입하는 데 어려움을 겪는 것으로 나타났다.

AI 기술은 빠르게 발전하고 있지만 정작 AI학습 및 운영을 위한 기업 내 데이터가 아직 충분히 갖춰지지 않거나 체계화되지 않아 제대로 활용할 수 없기 때문이다.

최근 세일즈포스가 발표한 ‘2024 연결성 벤치마크 보고서’에 따르면 62%의 기업에서 “아직 AI 활용에 필요한 데이터 시스템 통합이 준비돼 있지 않다”고 답했다.

AI 열풍이 불고 있지만 많은 기업들이 아직 데이터 전환에 어려움을 겪고 있다(이미지=달리)

15일 관련 업계에 따르면 기업들이 AI 도입을 검토하는 과정에서 가장 부담을 느끼거나 피로감을 느끼는 부분도 데이터로 나타났다.

GPT-4 등 생성형AI는 대규모언어모델(LLM)이라는 용어처럼 방대한 양의 데이터를 기반으로 한 사전학습이 필요하다. 데이터를 학습할수록 AI로부터 자연스러운 반응을 이끌어내고 오류율을 낮출 수 있기 때문이다.

오픈AI, 구글 등 빅테크 기업들은 이미 사전에 확보한 데이터를 거의 소진했으며, 보다 높은 AI성능을 확보하기 위해 저작권 규정도 무시한 채 추가 데이터 확보에 사활을 걸고 있다.

반면 일반 기업들은 내부 데이터도 AI학습을 위해 체계화하거나 일원화하지 않은 사례가 상당수인 것으로 알려졌다. 아직 많은 기업들이 IT역량이 부족해 AI 서비스를 도입 과정에서 데이터 통합이 필요하다는 것을 모르는 경우가 상당수라는 지적이다.

조직 또는 부서 간 갈등도 데이터 통합을 막는 주요 원인 중 하나로 지목됐다. 각 조직은 데이터를 개인자산이라고 생각하는 경우가 많아 데이터 통합 과정에서 이를 공개하는 것을 꺼리거나 공유를 반대한다는 것이다.

이로 인해 세일즈포스 설문조사 결과에 따르면 IT 리더 중 98% 이상이 조직의 디지털 혁신에 어려움을 겪고 있으며, 이중 81%는 데이터가 산발적으로 격리된 데이터 사일로가 AI 도입과 운영의 가장 큰 장벽이라고 밝혔다.

관련 기업들은 AI 도입에 앞서 자동화 도구 등을 활용해 데이터를 AI 학습에 적합한 방식으로 전환하는 과정을 반드시 거칠 필요가 있다고 강조했다.

특히 AI 전문 기업과의 소통을 통해 AI와 데이터의 연관 관계를 이해하고 AI 학습을 위해 사내 데이터를 어떻게 데이터베스화 할 것이지 충분히 고려해야 한다고 조언했다.

관련기사

조규곤 파수 대표는 “기존 데이터가 아무리 많더라도 데이터베이스화하지 않으면 AI에서 에서 제대로 활용하기 어렵다”며 “기업에서 활용할 목적에 따라 AI를 활용할 수 있도록 체계화해 데이터베이스를 구축해야 한다”고 강조했다.

옵스나우 조용석 IoT옵스 개발팀장은 “수많은 설비와 장비로 이뤄진 공장은 수만 개 이상의 센서에서 데이터가 끊임없이 생성되고 축적되지만 이를 그대로 AI에 활용할 수 있는 곳은 존재하지 않는다”며 “데이터의 특성이나 종류에 따라 적합한 DB모델로 분배하고 관리할 수 있는 플랫폼을 구축하지는 과정을 거치지 않으면 AI 도입을 위해선 더욱 많은 시간과 비용을 지출해야 한다”고 말했다.