"데이터 레이크, 민감정보 시한폭탄 우려"

엔코아 김범 전무 "민감정보 유출 우려, 데이터 가상화 필수"

컴퓨팅입력 :2022/06/01 09:39

“공공과 민간기업에서 빅데이터 활용을 위해 만든 데이터 레이크가 언제 터질지 모르는 시한폭탄이 되고 있다.”

엔코아 전략사업본부 김범 전무가 데이터레이크의 보안 취약점의 심각성을 강조하며 위와 같이 말했다. 이어서 그는 이를 극복하기 위한 대안으로 데이터가상화를 제시했다.

데이터 레이크는 조직에서 수집하는 정형, 비정형 데이터를 우선 저장하는 중앙집중식 저장소다. 모든 데이터를 한곳에 모아 데이터 접근도 용이하며, 인공지능(AI) 학습용 데이터셋 개발이나 데이터 분석 작업도 유리하다.

엔코아 전략사업본부 김범 전무

정부 부처도 디지털플랫폼정부의 핵심요소로 데이터레이크를 지목할 만큼 적극적으로 도입 중이다. 금융, 헬스케어 등 민간기업도 빅데이터를 활용하기 위해 데이터레이크 구축에 속도를 내고 있다.

문제는 한 공간에 대규모 정보가 쌓이는 구조상 민감정보 유출 등 보안사고 우려가 커지고 있다는 점이다. 특히 김범 전무는 현재 구축된 다수의 데이터레이크가 내부 보안 환경에 큰 신경을 쓰지 못한 것으로 파악된다고 밝혔다.

데이터레이크에 쌓인 데이터를 활용하기 위해선 통합·정제하는 과정을 거쳐야 한다. 별도의 처리를 거치지 않은 만큼 중복되거나 불필요한 자료를 걸러내야 하기 때문이다.

데이터 통합을 위해선 암호화된 데이터의 암호를 푸는 복호화를 거쳐야 한다. 문제는 이 과정으로 인해 민감정보가 데이터레이크에 그대로 노출된다는 것이다. 노출된 데이터는 데이터레이크에 접근할 수 있는 사용자는 모두 보거나 사용할 수 있다.

김범 전무는 “현재 클라우드, 온프레미스에 구축한 데이터레이크를 살펴보면 거의 대부분 모두 이런 상황을 겪고 있다”며 “최근 사이버공격이 급증하고 있는 상황인 만큼 언제 어느 기업이 공격당해도 이상하지 않을 상황”이라고 지적했다.

이어서 “데이터 레이크는 접근제어, 이력관리, 데이터 마스킹 등의 기능도 구현이 어려워 데이터 유출에 대한 사전 관리 및 사후 대응도 어렵다”며 “이미 많은 데이터 레이크가 이런 보안 대응 없이 개인정보를 축적하고 있어 언제 터질지 모르는 시한폭탄에 가까워지고 있는 상황”이라고 강조했다.

엔코아는 데이터레이크에서 발생하는 보안문제를 해결하기 위한 방안으로 데이터 가상화를 제시했다.

데이터가상화는 클라우드 등 별도 메모리 공간에 데이터를 실시간으로 활용할 수 있도록 제공하는 가상 데이터 레이어 서비스다. 물리적인 데이터 이동 없이 통제된 공간에서 데이터 복호화 및 데이터 통합 등을 진행해 민감정보 유출을 방지할 수 있다는 설명이다.

관련기사

김전무는 “가상화를 통해 구축된 레이어는 관계자만 출입하도록 접근을 제어하거나, 언제 누가 들어왔었고 어떤 데이터에 접근했는지 모든 이력을 확인할 수 있다”며 “특히 실시간 축적되는 데이터도 일정주기마다 레이어를 갱신하며 데이터를 안전하게 업데이트할 수 있다”고 설명했다.

이어서 그는 “데이터 가상화는 보안을 비롯한 데이터 레이크의 문제를 해결하기 위한 방안”이라며 “데이터 레이크의 대체가 아닌 상호 보완을 위한 솔루션이라고 할 수 있다”고 강조했다.