[일문일답] “기가 지니, 한국어 인식률 최고 자부”

자연어 인식률 90% 수준…2차 업그레이드 계획 중

방송/통신입력 :2017/01/17 15:16

KT가 음성인식(AI) 기능을 탑재한 IPTV 셋톱박스 ‘기가 지니’를 17일 선보였다.

기존에 출시된 AI 단말이 음성을 알아듣는 스피커 수준에 머물렀다면, 기가 지니는 IPTV 셋톱박스 형태로 나오면서 미디어와 융합된 AI 단말의 모습을 갖췄다. AI의 영역을 TV 화면을 통해 시각적인 부분까지 확장시켰다는 의미다.

백규태 KT 융합기술원 서비스연구소장은 “스마트폰이 처음 나왔을 때 많은 사람들이 터치 인터페이스의 편리함에 빠졌고 산업 패러다임이 바뀌었다”며 “최근에는 AI 제품이 음성 인터페이스를 기반으로 편의를 제공하는 산업 변화가 감지되고 있다”고 말했다.

이어, “터치와 음성 다음은 어디냐고 질문했을 때 답은 시각이다”며 “사람이 70% 이상의 정보를 받아들이는 부분은 시각이기 때문에 TV 화면을 보고 대화하는 AI 서비스를 내놓은 것”이라고 설명했다.

특히, TV를 중심으로 한 AI 서비스를 만들어냈다는 점 외에도 기가 지니가 더 주목받는 이유는 높은 음성인식률이다.

이에 대해, 백규태 연구소장은 “KT는 음성인식 기술을 25년전부터 연구해왔고, 실제 서비스로는 모바일 내비 뿐만 아니라 5년전부터 IPTV에 음성인식 서비스(채널변경 리모트콘트롤 등)를 해왔다”며 “시맨틱 추론 기술 등을 적용해 지금도 IPTV에 쓰고 있고 음성대화 지능을 높이고 있다”고 밝혔다.

다음은 임헌문 KT 매스총괄 사장, 강국현 KT 마케팅부문장, 백규태 연구소장 등이 기자들과 나눈 일문일답 내용이다.

왼쪽부터 백규태 소장, 이동면 원장, 임헌문 총괄, 강국현 부문장.

- 타사는 IBM 왓슨을 이용한다. 이 같은 협력 사례는 없는가. 그리고 인공지능 솔루션 차별화 지점은 무엇인가.

“한국어 인식을 25년간 연구했다. 인식률은 타사보다 특히 한국어는 국내 최고라고 자부한다. 현재는 자체 기술을 개발하고 있고 향후에는 써드파티와 협력해 나갈 예정이다.

아직 부족한 면들이 있다, 지식 축적 측면에서. 타사들 하고 협력해서 인공지능 수준을 높여가야 한다고 보고 있다.” (백규태 KT 융합기술원 서비스연구소장)

- IPTV 셋톱박스로 개발한 만큼 사용 설치 환경이 TV 아래다. 사운드바 형태로 하는 것이 더 좋지 않았는가. 보안 문제도 고려해볼 사항으로 보인다.

“개인화 기능을 넣었다. 집에서 혼자 계신 분도 있지만 가족이 함께 사용하고 있는 경우도 있다. 사람별로 목소리도 개인화 하는 것은 향후에 계획중이다. 현재는 개인을 식별할 수 있는 키번호 식인데, 철저하게 개인정보를 보호하고 개인 외에 다른 사람들이 쓸 수 없도록 하는 방안이 있다.

스피커를 사운드바로 왜 안만들었느냐는 질문에 대해서는 기가 지니 특징이 셋톱박스를 안에 넣어버린 점이다. 각종 연동 서비스가 융합되면서 TV 소리도 있고, 스피커 소리를 제어할 수 있고 에코캔슬 기능 등으로 소리를 차단하는 기술이 들어가야 했다. 플랫폼 구축이 되는데 개인화 추천이 가능하고 음악 추천 원하는지 기능을 넣으면서 설계된 디자인이다.” (백규태 소장)

- 기가지니에서 사용되고 있는 음성인식 기술이 자체기술이라고 했는데 추가 설명달라. 이를테면 타사 스피커와 정확도나 인식률은 어느 정도인지 궁금하다.

“음성 인식 기술은 알고리즘 기반으로 개발을 쭉 해왔다. 이제는 딥러닝 기반으로 올렸다. 자연어 인식은 89~90% 선으로 하고 있다. 타사와 비교를 하려면 똑같은 상황을 연출해야 하는데 그런 테스트 환경을 갖지 않았다. 비교하기 어려운 부분이다.

시연에서 확인할 수 있었지만 말을 했을 때 기계가 인식한 언어를 TV 화면에 텍스트로 그대로 적도록 구현하고 있다. 그만큼 자신이 있다는 뜻이다.” (백규태 소장)

- SK텔레콤 ‘누구’는 4만대 판매했다고 하는데 기가지니 판매 목표는?

“경쟁사 제품이 몇 대 팔리고 있는지 기사 보도를 통해서만 알고 있고, 알지 못한다. 내부적으로 판매 목표를 정하지는 않았다.

기가지니는 셋톱박스로 구현된 제품이다. KT가 1년에 판매하는 셋톱박스, 즉 IPTV 신규 가입자가 연간 120만명이 넘는다. 그 중에서 기가지니를 통해 가입자를 유치할 계획이기 때문에 충분한 가입자를 확보할 것으로 판단한다.” (강국현 KT 마케팅부문장)

- TV 연동 외에 스피커 별도 기능은 없나. 그리고 전력 소비량은 어느 수준인가.

“기본적으로 TV화면을 통한 비주얼 기능이 더 좋은 것은 당연하다. 하지만 TV 없이 스피커 단독으로도 동작한다. 때문에 별도 판매도 하는 것이다. TV와 함께 이용할 때 시너지를 낼 수 있다고 말할 수 있다.

전력소비량은 단독으로 작동할 때 9와트(W), 대기모드에서 7.82W다. 한달 1천원 정도 전기세가 나오는 수준이다. 저전력 모드에서는 0.38W 수준이다. 일반 셋톱박스보다 1~2W 높지만 부담이 갈 수준은 아니다.” (백규태 소장)

- 어제 인사 발표와 조직개편도 있었는데 올해 시장 전반에 대한 이야기를 달라.

“그동안 경험을 통해서 보면 가장 어려운 해가 항상 올해라고 해왔다. 올해도 도전이 필요하다고 본다. 전체적인 운용 방향을 도전으로 정했고, 마침 우연히 기가인터넷 가입가구가 250만을 돌파했다. 이 같은 기반 아래서 IPTV 1등 리더십을 확고히 지켜나가는게 한가지 방향이다.

지난해 기업 전용 LTE 바탕으로 무선에서 상당한 성과를 올렸다. 준비된 기업 전용 LTE와 더불어 NB(협대역)-IoT 서비스가 상반기 내에 출시될텐데, 두가지로 모바일 성과 기대하고 있다.

결국은 협력 기반이 가장 중요하다. 기가지니를 바탕으로 5G 얼라이언스, AI 얼라이언스 등 적극접 협력체게 구축해 차별화된 서비스를 꾸준히 선보이겠다.” (임헌문 KT 매스총괄 사장)

- 시연 상황에서 보여준 인식률이 상당히 높은 점이 놀랍다. 설정 상황 연출은 아닌가.

“어제 상황극 연습을 하는 것을 보고 저조차 똑같은 질문을 스탭에게 했다. 미리 촬영하고 미리 돌리는거 아닌가 싶을 정도였다. 짜여진 각본대로 대화하는데 모든 명령어를 그대로 인식하는 모습을 봤다.

설정 없이 주어진 질문을 모두 기가 지니가 인식한 것이 맞다.” (임헌문 사장)

- AI테크센터 조직을 신설했다.

“신설센터는 사실 인공지능 기반 기술을 더욱 높이는 목적이 있고 두 번째는 산업 전반적으로 준비하는 부분에 서비스로 나아가는 것이다. 인력이 필요하고 새로운 모델을 개발해야 한다. KT 내에 연구소가 3개 있고 사업부서가 많다. 어떤 정보를 습득하고 적용할지 딜리버리 할 수 있는 조직 체계 구축해서 가동할 예정이다.” (백규태 소장)

- 세계 최초 인공지능TV라고 발표했다. 다른 TV 연동 서비스와 차별화 포인트는 무엇인가.

“왜 굳이 TV라고 하냐는 점을 보면, TV와 연동하는 것들이 나오고 있긴 하다. 하지만 유기적으로 돌아가지 않고 자기만 돌아가고 셋톱박스 연동 정도다. 단말에서 TV가 하나의 서비스로 다른 서비스랑 엮이고 기술적으로도 엮여 있고 플랫폼으로 다 엮여 있다.” (백규태 소장)

- 서비스 고도화 업그레이드 계획은 어떻게 되는가.

“2차 업그레이드를 계획 중이고 먼저 셋톱박스 단말의 지능을 높이는게 우선 목표다. 기술방향성에 대해서 미리 공개할 수도 있지만, 서비스를 새롭게 선보이는 시점에 오픈하겠다.” (백규태 소장)

관련기사

- 스마트폰도 되는데 왜 TV인가.

“기가 지니는 TV가 아니더라도 일반 스피커로도 판다. 향후 에너지나 차량 쪽으로 접목이 가능하다고 본다. 다시 질문을 바꾸면 첫째가 TV였는가를 보자. 거실은 TV 중심이고 KT가 TV 자체 가입자 기반이 탄탄하기 때문에 확실한 용도가 있고 고객 기반을 가져가면서 인공지능을 도입하는데 도움 될 것으로 판단했다.” (임헌문 사장)