삼성전자 "친구처럼 소통하는 AI 만들겠다"

토론토 AI센터, '멀티모달 상호작용' 기술개발

홈&모바일입력 :2019/10/04 12:20    수정: 2019/10/04 12:20

삼성전자가 스마트폰에서 단순히 생활을 편리하게 만들어주는 기능을 넘어, 사용자와 같은 눈높이로 세상을 이해하고 친구처럼 소통할 수 있는 인공지능(AI)을 구현한다는 목표를 밝혔다.

스벤 디킨슨(Sven Dickinson) 삼성전자 토론토 AI센터장은 4일 삼성전자뉴스룸 기고문을 통해 토론토 AI센터의 연구 방향과 그가 생각하는 AI의 미래에 대해 이같이 전했다. 스벤 디킨슨은 토론토 대학교 컴퓨터 사이언스 학장을 역임한 저명한 컴퓨터 비전 전문가다.

스벤 디킨슨(Sven Dickinson) 토론토 AI센터장.(사진=삼성전자)

■말하고 듣고 보는 '멀티모달 상호작용' 기술 개발

토론토 센터에서는 AI를 활용해 이미지 속 사물의 종류나 상황, 위치 등을 인식하는 시각이해(Visual Understanding) 기술을 연구 중이다. 나아가 사용자의 음성뿐만 아니라 동작, 표정 등 다양한 정보를 종합해 사용자가 원하는 것을 기호에 맞게 제공하는 ‘멀티모달 상호작용(Multi-modal interactions)’ 기술도 개발하고 있다.

이 기술은 컴퓨터 비전과 더불어 디킨슨 센터장이 밝힌 토론토 AI센터의 핵심 역량이다. 그는 “전자제품이 컴퓨터 비전을 통해 사람의 눈처럼 시각 정보를 얻을 수 있다고 가정할 때, 이 정보를 사용자 음성대화 정보와 융합한다면 음성 또는 시각 중 하나의 정보에만 의존한 것보다 훨씬 자연스러운 멀티모달 경험을 제공할 수 있다”고 소개했다.

또 멀티모달 상호작용이 가능해지면 사용자가 AI 비서에게 말하는 것뿐 아니라 AI 비서가 사용자가 세상을 보는 방식과 동일하게 세상을 이해하고 반응하는 일이 가능해진다는 게 그의 설명이다.

디킨슨 센터장은 “어떤 제품을 구매했을 때 매뉴얼을 보며 버튼의 기능이나 순서를 외울 필요 없이 사용자가 원하는 걸 바로 기기에게 보여주고 말하기만 하면 된다”며 “기기가 사용자를 이해하고, 사용자와 비슷한 눈높이로 세상을 파악할 수 있게 하려면 컴퓨터 비전과 멀티모달 명령어 간의 상호작용이 필수”라고 말했다.

이어 “우리는 말하기, 읽기, 쓰기 등 다양한 의사소통 방법 중 어느 한 가지로만 소통할 때 불편함을 느낀다”며 “그래서 멀티모달 상호작용이 중요한 것”이라고 덧붙였다.

인공지능(사진=이미지투데이)

■"삼성 가전·TV·폰 사용 경험, AI 밑거름 될 것"

AI가 인간의 눈높이로 우리와 소통하기 위해 선행돼야 할 것은 사용자 경험이다. 디킨슨 센터장은 삼성전자의 가전제품, TV, 스마트폰 등 다양한 제품과 소비자 사용 경험을 기반으로 그가 꿈꾸는 AI 비전을 실현시킬 견고한 밑거름이 될 것이라고 전망했다.

사용자들의 사용 경험에 비춰 각 기기와 어떻게 의사소통을 하는지, 기기 별로 어떤 특정한 기능을 수행하는지, 사용자의 습관과 선호도는 어떠한지 등을 파악해 AI와 사용자 간의 의사소통 방식을 더욱 효과적으로 개선할 수 있다는 것.

디킨슨 센터장은 “컴퓨터 비전은 결국 이미지를 이해하는 데 그치는 게 아니라 세상을 이해하는 것”이라며 “진정한 AI는 인간의 행동을 모델링하고 이해할 수 있어야 한다”고 설명했다.

기기들이 인간과 똑같이 3차원 세계를 이해하고, 우리처럼 물체의 형태와 위치를 인지할 수 있다는 건 시각적 정보를 통해서 가능한 것인데, 단순히 보는 것 외에 ‘시각적인 맥락’을 공유하는 것이 ‘완성형’ AI 비서를 개발하는 데 있어 핵심이라는 것이다.

■"인간-기기간 정교한 상호작용, 개방성·정보 공유가 핵심"

완성형 AI를 추구하는 삼성전자는 지능형 시각 이해 분야를 선도하기 위해 다양한 연구 역량을 키우는 데 집중하고 있다.

디킨슨 센터장은 “삼성전자는 시각정보를 습득하고 처리하는 방식에서 더 나아가 인간과 기기의 자연스러운 대화를 기반으로 한층 고도화된 서비스를 제공할 수 있는 기술 개발에 집중하고 있다”는 점을 강조하며 “이런 노력이 없다면 사용자들은 서비스에 쉽게 실망하고 결국 그 서비스를 이용하지 않게 될 것”이라고 덧붙였다.

그의 설명에 따르면 ‘개방성’과 ‘정보 공유’는 AI를 정교하게 만들기 위한 핵심 요소다. 예컨대 AI가 과제 수행에 실패했을 때, AI 스스로가 사용자에게 ‘왜 그런 대응을 제시했는지’, ‘왜 제시하지 못했는지’에 대한 피드백을 줄 수 있어야 한다는 것. 이상적인 경우, AI 기기가 질문을 하거나 사용자에게 카메라를 조정해달라 하거나 다른 명령어 모드로 변경해달라는 등의 요청을 해서 적절한 후속 조치를 할 수 있다.

관련기사

디킨슨 센터장은 “시스템도 사용자의 생각을 알아야 하고 사용자 역시 시스템의 사고 과정을 이해해야 한다”며 “개방성과 정보 공유가 인간과 기기 간 상호작용을 더욱 정교화하는 데 핵심”이라고 조언했다.

전 세계 7곳에 포진한 삼성리서치 AI센터들은 각자의 핵심 영역을 필두로 센터간 협업도 진행하고 있다. 디킨슨 센터장은 “몬트리올, 케임브리지 AI센터 등과 긴밀하게 협업 중이며, 몇몇 연구 결과를 향후 삼성 제품과 서비스에 적용하는 것도 고려 중”이라고 말했다.