한림대성심병원, 데이터 레이크 클라우드 플랫폼 '히어로(HERO)' 개발

데이터정합률 99.99%, 국내 최고품질 공통 데이터 모델 의료데이터 보유

헬스케어입력 :2022/05/02 17:11

한림대학교성심병원(병원장 유경호)은 데이터 레이크 클라우드 플랫폼 ‘히어로’(HERO: Harmonic intEgrated Reasearch platfOrm)를 개발했다.

히어로는 연구자가 가장 효율적으로 빅데이터 및 인공지능(AI) 관련 연구를 이끌어나갈 수 있도록 돕는 빅데이터 활용‧분석 플랫폼이다.

연구자의 임상경험과 AI를 진료에 접목시킬 수 있는 연구를 최적화할 수 있는 플랫폼을 만들자는 아이디어에서 태어난 히어로는 약 6개월간 SK㈜ C&C와 협업을 통해 개발됐다.

두 기관은 한림대학교의료원 병원별 온프레미스 환경에서 표준화된 데이터 파이프라인을 구축하고, 데이터 생산장비 보완, 저장장비 내 데이터추출 기법 등을 새로 개발해 데이터 레이크를 구축했다.

데이터 레이크는 각 기관에서 수집된 다양한 데이터를 원시 형태(raw data)로 저장해 다양한 유형의 빅데이터를 관리하는데 최적화된 데이터 저장소를 말한다. 즉, 데이터 마트가 쉽게 마실 수 있도록 정제 및 포장된 생수 저장고라고 한다면 데이터 레이크는 보다 자연적인 상태의 큰 호수 자체를 말한다.

(제공=한림대학교성심병원)

데이터 마트나 데이터 웨어하우스는 데이터를 정제한 뒤 저장하고, 정형 데이터를 저장하는데 최적화되어있으며, 미리 정의된 목적이 있는 데이터를 저장하지만 데이터 레이크는 데이터를 저장하기 전에 정제를 하지 않고, 비정형 데이터도 저장할 수 있으며, 미리 정의된 목적이 없는 데이터를 저장하는 것이 차이점이다.

히어로는 프라이빗 클라우드와 퍼블릭 클라우드가 접목된 하이브리드 클라우드 환경에서 운영되며, 유연한 환경설정 안에서 데이터를 쉽게 파악하고, 분류 및 분석을 할 수 있다. 기존 ‘임상 데이터 웨어하우스(CDW)’가 제공하던 사용자 인터페이스·사용자 경험(UI·UX)도 대폭 개선해 연구자 친화적 플랫폼을 완성했다.

또 퍼블릭 클라우드 내에서 머신러닝을 통한 결과 예측모델 개발도 가능해서 기존 데이터베이스나 데이터웨어하우스보다 한층 진보된 플랫폼이다.

히어로는 데이터정합률 99.99%의 국내 최고품질의 CDM 의료데이터를 보유하고 있다. 최근 한국데이터산업진흥원 주관 데이터품질인증제도를 통해 데이터 표준, 업무 규칙, 데이터 패턴, 허용 범위, 코드값, 무결성, 표준정의 등 품질에 영향을 미치는 요소들을 종합적으로 심사받아 정합률 99.99%를 받았다.

특히 히어로는 SK㈜ C&C가 개발한 데이터 분석 플랫폼 아큐인사이트 플러스를 탑재해 데이터의 분석, 모델 생성, 배포, 관리 등의 연구를 빠르고 매끄럽게 진행할 수 있고, 고도화된 데이터 분석이 가능하다. 또 클라우드 환경을 통해 다기관 연구자들이 같은 공간에서 데이터 활용이 가능한 공동연구 생태계를 구축할 수 있다.

의료영상저장전송시스템(PACS) 내 이미지를 범용 이미지 파일 형태로 변환해 통합 관리하고 검색 조건에 따라 일괄 다운로드 받을 수 있다는 것도 히어로만의 장점이다. 이는 ‘자동판독 연구’ 등 의료 이미지 데이터 활용연구에 매우 효율적인 기능이다.

관련기사

서영균 빅데이터센터장은 “히어로를 통해 국책사업인 데이터중심병원 컨소시엄 등 다기관 데이터 공유 및 협력연구 생태계를 조성했다”면서 “앞으로 이번 플랫폼을 더욱 고도화시키고, 다양한 공동연구를 주도하는 등 한림대성심병원이 의료데이터 표준화 및 의료 빅데이터 연구를 선도하는 역할을 이어나갈 수 있도록 최선을 다하겠다”고 말했다.

한림대성심병원 빅데이터센터는 최근 한국데이터산업진흥원 주관 데이터품질인증제도에서 공통데이터모델(CDM, Common Data Model) 의료데이터로 데이터품질인증 부문 최고 등급인 '플래티넘' 등급을 획득했다.