"작년에 동형암호 기술 '혜안(HEEAN)'을 만들어 처음 암호화한 데이터로 머신러닝을 수행했고, 이 결과로 우승도 했다. 올해는 이 기술을 해외 연구팀들도 쓴다. 작년에 고유 기술을 갖고 나왔던 팀들이다. 인공지능(AI)과 머신러닝에 유용한 근사치 계산에 '혜안'이 월등히 유리하다는 점을 보여줬다."
서울대학교 수리과학부 천정희 교수가 19일 서울 양재동 엘타워 '개인식별방지기술세미나'에서 이같이 말했다. 그는 세미나의 '동형암호 글로벌 동향, 국제 표준화 동향, 국내외 활용사례'를 주제로 발표했다.
천 교수팀이 지난해 개발한 동형암호 소프트웨어 라이브러리 '혜안'이 세계 암호학자들 사이에서 AI 및 머신러닝 연산을 위한 동형암호 기술로 주목되고 있다고 언급, 눈길을 끌었다. IBM, 마이크로소프트 등 글로벌 IT기업들 관심도 높아지고 있다.
행사는 세계 동형암호 원천기술과 응용연구 분야에서 선두에 속한 천정희 교수 연구팀이 동형암호 기술을 활용해 데이터분석 환경에서 개인정보를 보호할 수 있는 사례와 동형암호 국제표준화 동향을 참석자들에게 소개하는 자리였다. 동형암호에 관심이 있는 학계 관계자와 일반인 대상으로 자리가 마련됐다. 과학기술정보통신부, 행정안전부, 금융위원회가 주최하고 한국정보화진흥원과 한국인터넷진흥원이 주관했다.
천 교수팀이 보안기술을 접목한 유전정보 연산 경진대회 참가 성과를 중심으로 국제연구동향을 소개하고, 지난해부터 글로벌 IT기업이 주축이 돼 3차례 열린 동형암호 표준화 워크숍의 논의 방향과 현황을 발표했다. 이어 과학기술정보통신부 '개인정보를 안전하고 편리하게 빅데이터 처리할 수 있는 방법' 연구과제를 수행한 고려대학교 정연돈 교수가 비정형데이터 익명처리기술을 소개했다.
이후 최근 지디넷코리아와 인터뷰를 진행한 한국스마트인증과 코리아크레딧뷰로(KCB)의 동형암호기술 산업계활용 사례가 제시됐다. 한국스마트인증은 지난 5월 동형암호를 활용한 홍채인증기술 공개 후 성능을 개선한 결과를 선보였다. KCB는 동형암호를 활용한 신용평가모형을 연구해, 암호화상태의 데이터로 머신러닝을 수행해 개인정보를 보호하면서 신용형가모형의 신뢰성, 정확성, 안전성 확보를 검증했다.
동형암호의 주요 개념, 장단점, 글로벌 표준화 및 실용화 연구 동향, AI와 머신러닝에 동형암호를 접목하려는 민간 기업의 움직임 등을 짚은 천 교수의 발표 내용을 정리했다.
■ "동형암호 재부팅 연산 성능, 확 빨라졌다"
동형암호는 암호화된 데이터를 복호화 없이 연산할 수 있게 해주는 암호기술이다. 복호화해야만 연산 결과를 얻을 수 있는 현대 암호와 달리, 데이터 유출과 도용 위험이 없다. 개인정보를 안전하게 보호하면서 이를 분석해 유용한 서비스와 시스템을 구현해야 하는 현대 사회에 잠재 활용가치가 매우 높다고 기대를 모으고 있다. 2009년 구현 가능성이 이론적으로 증명된 뒤 한국과 세계 각지서 연구가 진행 중이다.
동형암호의 장점은 뭘까. 첫째, 모든 종류의 컴퓨터 연산을 지원한다는 뜻의 '튜링 완전성'을 갖췄다. 둘째, 암호화한 상태로 통계처리, 검색, 머신러닝이 가능하다. 셋째, 해커의 데이터 유출 우려가 원천봉쇄된다. 단점도 있다. 첫째, 암호화한 데이터(암호문) 크기가 원문의 수십배로 는다. 둘째, 평문 상태로 연산하는 것보다 속도가 수백배 느리다. 셋째, 응용연산 종류별 속도차가 커서 개별적으로 최적화가 필요하다.
그런데 세미나에서 동형암호 천 교수는 동형암호의 단점인 성능을 극복하는 연구 성과를 얻고 있다고 밝혔다. 그는 동형암호 연산 중 가장 느린 '재부팅(Bootstrapping)' 연산의 성능 개선을 예로 들었다. 재부팅 연산이란, 값에 곱 연산을 반복해 노이즈가 커진 암호문을 노이즈가 작은 암호문으로 변경하는 과정이다. 노후화한 암호문, 암호화된 비밀키를 입력해 신규 암호문을 출력하는 연산이다.
천 교수는 "과거 최초 동형암호 재부팅 연산이 1비트를 재부팅하는데 30분이 걸렸는데, 5년이 지나 3만5천배 빨라진 0.05초가 걸린다"며 "이는 무어의 법칙에 따른 반도체 성능 발전을 고려하더라도 알고리즘의 향상에 따른 성과가 큰 결과"라고 강조했다. 이어 "내년 기대되는 연구 결과로는 여기서 35배가 더 빨라져 처리시간이 비트당 1밀리초 이하로 줄어, (당초 성능 대비) 100만배 빨라질 것"이라고 언급했다.
■ "동형암호 국제표준화 진행중…민간기업 참여 확대 추세"
동형암호 기술의 글로벌 표준화 움직임이 지난해부터 구체화하기 시작했다. 지난해 7월 미국 마이크로소프트(MS) 리서치에서 표준화 워크숍이 처음 열렸다. 이어 올해 3월 미국 매사추세츠공과대학교(MIT)에서 두번째, 지난달엔 미국 NIST, 국립보건원(NIH), 국방부 등이 참여한 가운데 세번째 워크숍이 진행됐다. 미국의 MS, IBM 등 IT거인과 몇몇 스타트업, 한국 삼성SDS와 프랑스 젬알토 등 기업이 참여 중이다.
워크숍에서 크게 보안(Security), API, 애플리케이션, 3가지 영역의 표준문서가 작성되고 있다. 3가지 표준화된 구성요소를 갖춰야 동형암호를 안전하고 유용하게 쓸 수 있다는 판단에서다. 천 교수는 "이제 보안 표준문서 작성은 완료된 상태고, API 표준 문서는 초안(draft) 회람이 진행되고 있고, 다음은 애플리케이션 표준 문서 차례"라며 "올해 보안 및 API 표준 문서 다음 버전에 '혜안'이 추가될 것"이라고 언급했다.
3가지 표준문서는 어떤 내용을 다룰까. 천 교수의 설명에 따르면, 보안 표준은 현대 암호해독기술에 견딜 수 있는 파라미터의 최소크기 등을 제안한다. 그리고 API는 암호전문가가 아니라 일반 기업 개발자도 동형암호를 편리하게 쓸 수 있도록 만드는 데 필요하다. 또 애플리케이션은 동형암호를 어떤 용도로 쓰느냐에 따라 안정상이 달라질 수 있기 때문에 안심하고 쓸 수 있는 영역을 열거하는 작업이다.
천 교수는 동형암호 워크숍이 3회째 열리면서 점차 민간기업의 참여 확대가 두드러지고 있다고 지적했다. 그만큼 실용화가 가깝다는 의미다. 앞서 동형암호 연구팀을 보유한 IBM, MS, 삼성SDS뿐아니라, 담당조직을 신설한 인텔과 SAP가 3회 워크숍에 참석했다. 엔베일(ENVEIL), 듀얼리티테크놀로지스, 크립토랩 등 동형암호기술 스타트업과 에니그마, 누사이퍼, 래셔널마인드같은 블록체인업체까지 가세했다.
■ 국제 보안경진대회서 경쟁 연구팀이 '혜안' 써…청출어람?
아직 민간분야에서 실제 사업에 동형암호를 적용한 사례는 없다. 실용화 연구가 활발한 분야가 있다. 엄격한 관리가 필요하지만, 가공과 분석을 통해 얻는 가치가 높은 의료정보 분야에서 동형암호 활용가능성이 주목받고 있다. 더불어 천 교수팀의 '혜안'은 여타 동형암호와 달리 '근사치 계산'을 지원한다. 근사치 계산으로 유용한 결과를 얻을 수 있는 머신러닝, AI 분야에 혜안을 활용하려는 움직임이 두드러진다.
천 교수는 의료정보 분석 및 보안기술 경진대회중 하나인 '국제게놈보안경진대회(iDASH Competition)'에 3년 전부터 동형암호 활용 사례가 등장하면서 발전하고 있다고 밝혔다. 천 교수 설명에 따르면, 이 경진대회는 5년전 미국 NIH 후원으로 만들어졌다. 클라우드컴퓨팅 방식으로 정보유출 없이 유전정보를 분석해 암과같은 유전성 및 난치성 질환 극복에 유용한 길을 찾는다는 목표로 시작됐다.
이전까지 유전정보에 해시(Hash) 처리나 비식별화 기술을 사용했는데 2015년(태스크1 및 태스크2)부터 동형암호 기술이 동원되기 시작했다. 초기 동형암호 연산을 적용한 분야는 카이제곱 및 편집거리 등 간단한 통계처리 알고리즘이었다. 재작년(트랙3)에도 암호화한 유전정보 데이터를 테스트할 때 보안상 안전하게 아웃소싱하는(secure outsourcing) 단순한 기법에 쓰였다. 지난해에는 좀 달랐다.
천 교수는 "지난해(트랙3)에는 간단한 머신러닝 기법의 하나인 로지스틱 회귀(Logistic Regression) 모델에 기반한 머신러닝 태스크에 동형암호가 적용됐고, 가상의 태스크를 다뤘던 과거와 달리 올해(트랙2)는 유전체기반 질병연구단체에서 실제 수행하는 것과 동일한 태스크(GWAS)를 수행한, 현실과 매우 근접한 태스크의 결과를 가지고 경쟁했다"고 설명했다.
천 교수팀은 지난해 이 경진대회 트랙3에서 혜안을 사용해 머신러닝 모델 연산을 수행해 얻은 결과를 제출해 우승했다. 당시 프랑스 연구기관 CEA LIST, 벨기에 르우벤대학교(KU Leuven), 스위스 로잔 연방공과대학(EPFL), MS리서치, 일본 와세다대학교, 독일 살란트대학교(Saarland University), IBM 등 미국과 유럽 각지 연구팀보다 우월한 성능을 선보인 덕분이었다.
하지만 올해 이 대회 트랙2의 GWAS 태스크에서는 '혜안'의 유용함을 알아보고 이를 앞다퉈 차용한 연구팀에 따라잡히고 말았다. 천 교수가 제시한 트랙2 태스크 결과표를 보면 A*FHE팀, 키메라팀, 델프트블루팀, UC샌디에이고팀, 듀얼리티테크놀로지스팀, IBM 등 학계와 민간기업이 모두 천 교수팀의 혜안을 사용했고, 일부는 더 뛰어난 성능 또는 자원효율(더 낮은 최대메모리점유율)을 기록했다.
천 교수는 "학생들이 더 열심히 준비했는데, 결과의 정확성은 우수했지만 속도는 부족해 아쉽게도 올해는 수상을 못했다"고 말했다. 이어 "왜인가 보니 작년까지 미국, 유럽, IBM 팀이 제출한 스킴(scheme)이 고유기술이었는데 올해 우리가 갖고 있던 기술을 구현해 쓰고 있었다"며 "혜안이 모든면에서 나은 건 아니지만 근사치 계산으로 충분한 AI와 머신러닝 분야에선 월등히 유리함을 보여준 것"이라고 덧붙였다.
■ 유일한 근사치 연산 동형암호 기술 '혜안', 머신러닝 응용에 주목
국내외 동형암호 기술 확보와 상용화를 위한 움직임은 가속화 추세다. 사티아 나델라 MS 최고경영자는 올해 상반기 AI의 학습시 이용자 데이터를 보호하는 수단으로 동형암호를 쓰겠다는 뜻을 밝혔다. 이는 직접 언급되지 않았지만 MS가 주력하고 있는 사업 분야이자 AI의 실질적인 구동환경인 클라우드 컴퓨팅 영역에 경쟁사 대비 우수한 보안을 제공하는 기술로도 동형암호를 쓸 수 있음을 시사했다.
9년전 동형암호의 실용화 가능성을 입증한 IBM에서도 동형암호에 집중 투자 의지를 내비쳤다. 회사는 향후 5년간 투자할 5대 기술 중 2번째로 '격자암호(Lattice Cryptography)'를 꼽고 있는데, 격자암호가 동형암호의 기반기술이기도 하다는 게 천 교수의 설명이다. 구글은 데이터 질의에 부분적으로 동형암호를 쓰는 '빅쿼리' 클라이언트 라이브러리를 내놨고, 듀얼리티와 엔베일 등 관련 스타트업도 등장하고 있다.
천 교수는 "동형암호 기술을 쓰려는 모든 이들이 논문을 보고 연구해 활용할 수는 없고, 극소수 업체가 기술을 선도해 나갈 것"이라며 "기존 암호 기술은 보안업체들이 활용했다면 동형암호기술은 데이터분석업체들이 많이 활용하려 할 것이고, 라이브러리 공개나 표준화가 더 필요한 상황"이라고 지적했다. 이어 "공개된 라이브러리를 목적에 따라 찾아 써야 한다"고 조언했다.
관련기사
- "동형암호, 더 안전한 금융 빅데이터 실현"2018.11.20
- "생체인증, 동형암호로 더 안전해진다"2018.11.20
- 가명정보 활용과 결합에 관한 3가지 궁금증2018.11.20
- 4세대 암호 '동형 암호' 주목...하반기에 세계 첫 상용화2018.11.20
그는 '혜안'을 비롯해 동형암호 연구팀들이 외부인들의 참여를 위해 몇몇 암호 라이브러리를 내놓은 상황이며 향후 이런 라이브러리가 여러 목적에 맞게 활용될 수 있다고 언급했다. 그는 2012년 나온 HELib, 2015년 나온 SEAL과 FHEW, 2016년 나온 NFLlib, 2017년 나온 PALISADE, cuHE, 혜안, TFHE 등을 소개했다. 이가운데 혜안은 근사치계산을 수행하는 유일한 라이브러리라고 강조했다.
혜안의 주특기인 근사치 계산은 AI와 머신러닝 실용화 방향과 맞물린다. 천 교수가 소개한 2017~2018년 미국 전기전자공학회 발행 저널과 컨퍼런스 발표 논문(IEEE Xplorer) 통계를 보면 수십건의 결과 중 동형암호 응용분야 중 '머신러닝'이 11건으로 최다였다. 이밖에 천 교수는 삼성SDS와 클라우드 분야 응용연구를 수행 중이고, 동형암호를 블록체인과 결합하는 스타트업의 아이디어도 제안받고 있다고 언급했다.