ETRI, 세계 최고 AI 영상대회서 세계 1위

CVPR 개최 CLIC 저비트율 영상 압축 부문서 세계 1,2위 달성

과학입력 :2020/06/18 10:59    수정: 2020/06/18 10:59

국내 연구진이 세계최고 인공지능(AI) 영상 분야 대회서 세계 1위를 차지했다.

한국전자통신연구원(ETRI)은 세계적 컴퓨터비전 학회인 CVPR(Computer Vision Pattern Recognition)이 미국 시애틀에서 14일 온라인으로 개최한 인공지능 기반 영상 압축 기술 경진 대회(CLIC, Workshop and Challenge on Learned Image Compression)에 두 팀이 참가해 각각 세계 1위와 2위 성적을 거뒀다고 18일 밝혔다.

ETRI 'EIC-PQE'팀이 ELO 획득 점수 2258점으로 1위, 'EIC-E2E-P'팀이 ELO 획득 점수 2177점으로 2위를 차지했다.

ETRI는 "이로써 연구진은 몰입감과 현장감을 극대화할 수 있는 초실감 미디어 서비스 활용과 차세대 비디오 압축 국제표준화 선도를 위한 원천기술을 확보하게 됐다"면서 "기존 MPEG, HEVC 등 국제표준 압축 기술에 이어 진화하는 미디어 콘텐츠를 효율적으로 이용할 수 있는 획기적 인프라 기술 개선에 큰 도움이 될 것"이라고 밝혔다.

올해로 3회째를 맞이한 'CLIC' 대회는 구글, 페이스북, 넷플릭스 등 세계 유수 기관이 주관하고 후원하는 인공지능 기반 영상 압축 기술 관련 유일한 대회다. 최근 VR, AR, 홀로그램 등 미디어 콘텐츠 용량이 커지고 복잡해지고 있는데, AI를 이용해 기존 방식 한계를 뛰어넘는 압축률과 복원 영상 화질 등을 최적화하기 위한 산업 동향에 따라 대회 중요성이 커졌다.

대회 심사 부문은 ▲저비트율 영상 압축(Low-rate compression) ▲비디오 압축 두 개 분야다. ETRI는 저비트율 영상 압축 부문에 두 팀이 참가해 세계 기업 및 대학 연합팀들과 기술력을 겨뤘다.

- ETRI 연구진이 ETRI가 개발한 화질 개선 신경망 설계도를 설명하고 있다

ETRI가 참가한 저비트율 영상 압축 분야는 HD부터 4K 해상도의 다양한 자연 영상 428개를 화소당 0.15 비트율(bpp bpp: bit per pixel) 이하로 압축한 뒤, 다시 이를 복원한 결과물의 화질 수준을 경쟁하는 방식으로 이뤄졌다. 원본 영상은 평균 24비트율을 지녀 기존보다 최대 160분의 1 크기로 용량을 줄이면서도 화질을 떨어트리지 않는 것이 관건이다.

화질은 원본 영상을 압축한 뒤 복원한 영상의 '인지 화질'을 기준으로 평가했다. '인지 화질'은 거리와 밝기 등 정해진 프로토콜 환경 기준을 두고 사람이 직접 점수를 매겨 순위를 매기는 평가 방식이다.

ETRI 참가 팀 중 하나인 'EIC-PQE'는 기존 영상 압축 기술에 화질을 개선을 위한 후처리 기술에 AI를 적용한 방식을 사용했고. 다른 한 팀 'EIC-E2E-P'은 영상 압축 전 과정에 처음부터 AI를 도입한 방식으로 출전했다.

연구진 기술은 지난해 발표한 '엔트로피 최소화 기반 영상 압축'기술 등 원천 기술을 바탕으로 자체 기술력을 보유했다는 점에서 기존 공개된 여러 기술들을 조합해 나온 타 팀과 차별화된다고 ETRI는 설명했다.

대회에는 총 55개 팀이 참가했다. 영상 화질 비교 평점 방법은 엘로(Elo) 방식이 사용됐다. '엘로'는 2명제 게임에서 실력 측정 및 평가 산출법으로, CLIC에서 주관적 화질 성능 비교 방법으로 2019년부터 활용하고 있다.

ETRI는 작년 'CLIC 2019' 경진대회에서도 복원 속도 부문(올해 대회에서는 사라짐)에서 우승을 한 적이 있어 2년 연속 최고 성적을 거두는 쾌거를 거뒀다.

연구진은 해당 기술을 차세대 비디오 부호화 국제표준 원천기술로 제정하기 위한 노력도 진행할 계획이다.

ETRI 김흥묵 미디어연구본부장은 "홀로그램, 라이트 필드(Light Field: 광학소자를 통해 빛의 세기와 방향을 다르게 입체 영상을 표시하며 보는 시점에 따라 사물의 깊이나 옆면도 볼 수 있어 보다 자연스러운 시청 구현이 가능한 차세대 영상 기술), 포인트 클라우드(Point Cloud, 어떤 좌표계에 속한 점들의 집합을 이르는 말로 3D 스캐너를 통해 모델링, 시각화를 이루는 표현 방식) 등 입체 영상 시대가 도래하면서 기존 방식으로는 한계가 있던 분야에서 AI를 활용해 차세대 미디어 콘텐츠 확산을 이루는 기반 기술을 더 적극적으로 연구하겠다"고 말했다.

관련기사

연구진은 향후 최신 비디오 부호화 표준인 HEVC 대비 4배 압축 성능과 화질 개선, 속도를 높이는 연구를 지속하면서 관련 분야 기술 우위를 점할 방침이다.

이번에 쾌거를 거둔 기술은 과학기술정보통신부와 정보통신기획평가원(IITP) 지원으로 이뤄진 '초실감 테라미디어를 위한 AV부호화 및 LF미디어 원천기술 개발' 과제 일환으로 개발됐다. ETRI는 이 기술과 관련해 국내외 특허 38건을 출원했고, 인공지능 분야 톱3 학회인 ICLR2019를 비롯해 국제논문 18건을 발표했다.