"해커 막는 AI, '보안 학습 데이터' 없으면 못 만들죠"

이글루코퍼레이션, 보안 학습 데이터 시장 출사표

컴퓨팅입력 :2022/07/21 14:34    수정: 2022/07/21 16:20

"인공지능(AI) 기반 탐지 모델을 만들려면, AI가 공격 행위와 정상 행위를 구분할 수 있게 학습시켜주는 데이터가 필요하다. 지금까지 보안에서 데이터는 솔루션을 사면 당연히 줘야 하는 것이라고 인식됐지만, AI 기반 보안 분야에서 학습 데이터는 전문 영역으로서 가치를 인정 받게 될 것이다."

이글루코퍼레이션의 정일옥 전문위원은 최근 서울 문정동 이글루코퍼레이션 사무실에서 진행한 인터뷰에서 "보안 학습 데이터는 AI를 활용해 보안을 강화하려는 기업은 물론 이 분야에 새롭게 진출하려는 스타트업, 연구자들에게 모두 필요하다"며 회사가 우리나라에서 이 영역을 개척해 나가고 있다고 소개했다.

이글루코퍼레이션은 지난 3월 이글루시큐리티에서 '시큐리티'를 떼어 내고 새 이름을 달았다. 23년 만에 사명이다. 사업 영역이 사이버보안을 넘어 AI, 빅데이터, 클라우드로 확산하고 있는 만큼 사명 변경을 통해 정체성을 새롭게 정의한 것이다.

정일옥 이글루코퍼레이션 전문위원

데이터 사업은 AI 산업 전망을 고려했을 때 이글루코퍼레이션이 특히 힘을 주는 분야다. 최근 AI 기술은 해커의 공격을 막는 사이버보안 분야에도 빠르게 적용되고 있다. 이미 알려진 공격행위를 가지고 동일한 공격을 탐지(룰 기반 탐지)하는 방식으로는 점점 지능화되고 있는 해커들을 따라잡기가 어려워졌기 때문이다.

정 위원은 "올해 6월 미국 라스베이거스에서 열린 세계최대 보안 전시회 RSA에서는 통합보안관제(SIEM)부터 엔드포인트 위험 탐지·대응(EDR)까지 거의 모든 솔루션들이 AI 기반 기술을 쓴다고 했을 정도 AI가 빠르게 보안에 접목되고 있다"고 말했다.

이글루코퍼레이션은 AI 보안이 뜨는 만큼 AI 모델 구축에 필요한 '보안 학습 데이터' 수요도 커질 것으로 보고 있다. 2018년부터 AI 기반 SIEM을 시장에 공급하면서 쌓은 데이터와 라벨링 역량으로 사업화에 나섰다.

정 위원은 "이글루 내에는 AI솔루션을 만드는 개발팀과 여기에 필요한 학습데이터를 만드는 데이터사이언티스트팀이 각각 있다"며 "그동안 데이터사이언티스트팀이 내부 AI 개발팀에만 학습데이터를 만들어줬다면, 이제는 이 데이터를 외부에도 공개하고 사업화하려고 한다"고 설명했다.


회사는 두 가지 방식으로 데이터 사업을 추진 중이다. 하나는 '표준 학습 데이터셋'을 제공하는 일이다. 정 위원은 표준 학습 데이터셋에 대해 "기존에 발생한 사고에서 IP정보 등 공격 행위를 추출할 수 있는 관련 데이터들을 가지고 표준 데이터셋을 만들면 다른 곳에서도 이와 비슷한 행위가 일어났을 때 탐지가 가능하다"고 설명했다.

또 다른 하나는 기업이 가진 보안 데이터를 AI가 학습 가능한 형태로 레이블링해주는 사업이다. 이런 사업 영역이 필요한 이유에 대해 정 위원은 "기업이 보안 솔루션을 쓰고 있으면 자동으로 데이터가 수집되고 만들어지는데, 데이터가 많아도 AI학습에 활용할 수가 없다. AI가 학습할 수 있는 형태로 레이블링이 되어 있지 않아서다"고 설명했다. 이어 "우리는 기업에 컨설팅, 데이터 레이블링 및 학습 데이터셋 구축, AI 시스템에 적용에 이르는 과정을 모두 지원하려고 한다"고 했다.

데이터 사업 전망이 마냥 장밋빛은 아니다. 아직 데이터에 대한 제값주기 인식이 부족하기 때문이다. 지금까지 보안 솔루션을 사면 탐지를 위한 데이터를 무료로 넣어줬기 때문에, 인식 전환이 더욱 어려울 수 있다. 하지만 AI 학습 데이터는 기존 룰기반 탐지 데이터와 달리 가치를 평가해 줘야 한다는 게 정 위원의 생각이다.

"AI 학습 데이터를 만드는 데 고급 전문인력이 필요하고 리소스가 많이 들어간다는 점, 또 정확도를 높이기 위해 해당 기업(사이트)의 현황을 고려해야 하고 데이터를 지속적으로 관리해 줘야 한다는 점"에서 큰 차이가 있다고 정 위원은 설명했다.

궁극적으로 보안 AI 학습 데이터 시장이 활성화돼야 AI 보안 시장도 발전할 수 있다. 정 위원은 "결국 데이터가 있어야 AI 보안 분야에 새롭게 진입하려는 스타트업, 연구자들이 활동할 수 있다"며 "보안 데이터는 기업의 기밀이라 그냥 공유할 수 없기 때문에 학습 데이터를 전문적으로 만들어주는 영역이 발전해야 한다"고 강조했다.

관련기사

이런 이유로 한국인터넷진흥원(KISA)도 사이버보안 AI 데이터셋 사업을 추진하고 있다.이글루코퍼레이션도 지난해 KISA가 진행한 '침해 사고 분야 AI 데이터셋 구축 사업'에 참여했다.

이글루코퍼레이션은 향후 스마트공장, 산업운영기술(OT), 자율주행차 등 다양한 분야로 데이터 사업을 확장해 나갈 계획이다. 정 위원은 "이글루코퍼레이션이 보안 영역에서 강점을 가지고 있기 때문에 보안에서부터 데이터사업을 시작했지만, 회사가 자율주행차, 스마트공장 등으로 사업 영역을 확장해 나가고 있는 만큼 이런 역량을 기반으로 다양한 분야에서 데이터셋 구축 사업을 펼칠 수 있을 것으로 기대한다"고 말했다.