한국전자통신연구원(ETRI)은 CCTV 영상에서 쓰러진 사람을 실시간으로 탐지하는 인공지능(AI) 기술을 개발했다고 17일 밝혔다. 도심 안전사고 예방 및 비상시 신속한 조치로 더 안전한 사회 실현에 기여할 전망이다.
ETRI는 이번 ‘딥뷰(DeepView)’기술을 대전광역시에 적용한다. '딥뷰'는 도심지역에서 주취자, 노숙자, 실신 등 쓰러진 사람을 실시간 탐지하는 행동인식 AI 기술이다. 안전사고 예방 및 신속한 응급 구조조치 등에 활용 가능해 안전한 도시를 건설하기 위한 핵심 기술이다.
기존 행동인식 기술 대부분은 먼저 사람을 탐지하고 자세를 인식하는 2단계 구조로 이뤄진다. 이에 따라 서 있는 사람에 비해 비정형 자세의 사람, 즉 웅크리거나 쓰러진 사람은 잘 탐지하지 못하는 등 미탐지가 많았다. 반면 '딥뷰'는 CCTV 영상 속 사람의 18가지 관절 포인트 및 6가지 자세 정보 등을 종합해 행동을 정확히 인식한다고 ETRI는 설명했다.
연구진은 연관성이 높은 데이터를 동시에 이해해 판단하는 최적의 딥러닝 모델을 개발해 비정형 자세 인식률을 획기적으로 개선하는 한편 탐지 시간을 단축했다. ETRI는 이 기술의 핵심이 사람 영역과 세부 관절 위치, 자세 데이터를 동시에 활용해 사람의 행동을 정확히 인식하는 것이라고 설명했다.
즉, 단계별로 행동을 인식하는 것이 아니라 여러 판단 요소를 동시에 고려하는 모델을 개발해 실제로 특정 영역에서 사람이 쓰러졌는지 아닌지 등을 자동으로 검출한다. 연구진은 자체적으로 구축한 5만 5천여 건의 사람을 포함하는 이미지 데이터와 9만여 건의 사람 영역, 세부 관절 위치, 자세로 구성된 고품질 데이터셋을 딥러닝 학습에 함께 활용하면서 정확도를 높였다.
사람이 쓰러지는 경우 즉각적인 실시간 대응 및 골든타임 확보가 중요한데, '딥뷰'는 CCTV 영상 관제 시스템과 연동해 쓰러진 사람을 실시간으로 탐지해 관제센터에 알린다. 이처럼 시각지능 '딥뷰' 기술이 적용되면 광역 감시를 통해 CCTV 관제 사각지대를 해소하고 112, 119 등과 연계해 사고의 신속한 대응 및 예방으로 시민안전에 크게 기여할 전망이다.
ETRI는 대전시와 협력해 6월부터 이 기술에 대한 실증을 수행 중이다. 향후 지속적인 학습데이터 보완을 통해 정확도를 높여나갈 방침이다. 또, 모델 안정화와 채널 확대를 위한 경량화 작업도 병행할 계획이다.
대전광역시 유세종 시민안전실장은 "도심에서 발생하는 쓰러진 사람을 실시간 자동 탐지하는 기술은 안전사고 사각지대를 해소하고 시민의 생명을 구하는 중요한 기술로 향후 대전시에 확대 적용해 스마트하고 안전한 대전을 만들도록 최선을 다하겠다”고 말했다.
ETRI 민옥기 지능정보연구본부장은 "사람의 자세가 반듯하지 않아도 높은 정확도로 빠르게 이상행동을 인지하는 ETRI 시각 인공지능 기술로 안전하고 쾌적한 도시를 견인하는 데 계속 기여하겠다”고 말했다.
이번 기술은 사회문제 해결을 위한 ITU 'AI for Good 2021' 국제행사에서 사회문제 해결을 위한 AI 기술로 소개된 바 있으며, 세계 최대 영상보안학회(AVSS)에 정규 논문으로 발표됐다. '딥뷰'는 탁월한 연구성과로 2019년에 이어 올해 국가연구개발 우수성과 100선에도 선정됐다. 연구진은 국내 인공지능 산업 생태계 활성화를 위해 사람 상태 이해 기술 및 데이터셋을 12월 일반에 공개할 예정이다.
이를 통해 관련 기술의 외국 의존도를 탈피하고 국내 산학연이 경쟁력 높은 기술을 확보하는 등 산업 생태계 조성을 위해 적극 지원할 계획이다. 이 밖에도 연구진은 앞서 시각지능 '딥뷰'를 활용한 실시간 쓰레기 무단투기행위 탐지 기술을 개발해 서울 은평구 및 세종시에 성공적으로 실증을 마무리한 바 있다.
현재 기술이전을 통해 대전 유성구에 쓰레기 무단투기 단속 시스템 적용 시범사업을 추진하는 등 공공 사회문제를 해결하기 위해 다양한 노력을 기울이고 있다. 연구진은 과학기술정보통신부 혁신성장동력프로젝트(인공지능) 사업 일환으로 '(딥뷰) 실시간 대규모 영상 데이터 이해 및 예측을 위한 고성능 비주얼 디스커버리 플랫폼 개발' 과제를 수행하고 있다.