방송 미디어에는 어떻게 AI를 도입하나

기술적 한계에 따라 생산자·이용자 별 맞춤형 모델 개발

방송/통신입력 :2017/05/18 18:03

방송 미디어 영역에 인공지능(AI) 기술은 어디까지 영향을 미칠까?

당장 일부 OTT 서비스나 IPTV의 VOD 검색 등에서 맞춤형 콘텐츠를 제공하는 부분부터 시작됐다. 최근에는 음성인식 기반 AI 스피커와 IPTV 서비스를 결합한 셋톱박스도 나왔다.

지금까지 나온 방송 관련 AI 기술은 주로 방송 콘텐츠의 이용자 소비 단계에서 간헐적으로 등장했다. 콘텐츠 제작 단계에는 이르지 못하고 있다. 그만큼 실질적인 편의를 위해 AI를 도입하기에는 아직 부족하다는 뜻으로 풀이된다.

18일 서울 코엑스에서 열린 2017 국제방송기술컨퍼런스에 연사로 참석한 전윤호 알티캐스트 AI비즈 TF장은 “최근 딥러닝 기술이 획기적으로 발전햇지만, 패턴 인식 등 일부 영역 외에는 아직 한계가 많다”고 말했다.

음성인식 AI 스피커 신제품이 연이어 나오고 천재 바둑기사를 이기는 AI 알고리즘이 만들어지는 시대지만, 방송 미디어 영역에 접목하기에는 각각의 방식마다 어려움이 있다는 뜻이다.

전윤호 알티캐스트 AI비즈TF장.

■ AI 기술의 발전과 한계

우선 영상 콘텐츠를 AI로 인식하는 면에서는 얼굴 검출이나 인물 인식, 표정 인식 등의 기술이 가시화되고 있다.

AI가 각광을 받고 있는 최근이 아니더라도 과거 공항에서 쓰이는 물리보안 등에서 도입했던 방식이다. 즉 기술 수준은 일정 정도 지점에 올라있다.

그럼에도 화면이 빠르게 움직이거나 그림자가 지는 등 일부 제약이 주어진 영상 콘텐츠 내에서는 인식률이 떨어진다. 또 셋탑박스나 TV 등 엣지 디바이스 수준에서 실시간 인식을 컴퓨팅으로 처리하기에는 하드웨어 사양이 부족하고, 반대로 사양을 올리면 높은 비용이 발생한다.

미디어 콘텐츠를 전달하는 하드웨어가 사용자인 시청자를 인식하는 기술의 방법도 있다. 이를테면 시청자의 인물 인식, 표정 인식 등으로 광고가 효과적으로 전달되고 있는지 측정할 수도 있다. 이 부분에서는 기술 수준 외에 프라이버시가 발목을 잡을 수 있다.

기계가 작곡을 하거나 기사를 작성하는 등 콘텐츠를 창작하는 지점에서도 AI를 도입할 수 있지만 노동집약적인 편집이나 반복되는 이미지 자동생성 정도가 현재 수준의 AI가 대신할 수 있는 정도로 꼽힌다.

■ 음성인식에 GUI를 더한다면?

AI 기술에 한계가 있더라도 방송 미디어 영역에 도입될 가능성이 없는 것은 아니다.

전윤호 TF장은 “현재 AI 기술을 한계와 특성에 맞춰 잘 활용하고, 사람과 협업하는 방식으로 다양한 새로운 응용이 가능하다”고 내다봤다.

이를테면 현재 알티캐스트가 개발하고 있는 ‘보이스어블(Voiceable)’처럼 음성인식 기반의 셋톱박스에 그래픽 인터페이스를 더해 이용자가 더욱 편리하게 미디어 기기를 제어할 수 있는 방법을 제시했다.

전 TF장은 “AI 스피커는 사용자와 주고 받는 대화 내용에 의해 맥락이 만들어지는데 제약이 없는 대화를 주고받기 위해 훨씬 더 많은 학습량이 필요하다”면서 “그래픽 유저 인터페이스(GUI)가 더해진다면 이용자와 기계 입장에서 대화의 맥락을 화면으로 만들 수 있다”고 설명했다.

최근 아마존이 선보인 에코쇼와 같이 디스플레이를 탑재해 음성인식 기능을 보완할 수 있다는 뜻이다.

보이스어블 사례 외에도 AI를 보조재 수준으로만 활용하는 단계는 현재도 크게 어려운 일이 아닐 것이란 전망을 내놨다.

관련기사

화면 속 인물 정보나 제품 정보를 인식하는 수준을 아직은 낮은 단계에서 기대하는 방식을 도입하거나 디바이스와 인터랙션을 도와주는 수단으로 도입할 수도 있다.

나아가 영상 콘텐츠 생성이나 변환 등에서 창의성에 기대기보다는 작업 효율 향상 면으로 AI를 도입하는 것도 하나의 방법이 될 전망이다.