"미래 사진편집, 손 대신 말로"…어도비 신기술 개발

어도비리서치, '자연어 이해' 적용한 사진편집 영상 공개

컴퓨팅입력 :2017/01/17 07:48    수정: 2017/01/17 07:59

어도비가 손 대신 말로 하는 사진편집의 세계를 선보였다. 지난주 유튜브에 게재한 30초짜리 콘셉트 영상을 통해서다. 완전히 새롭게 만들어진 기술이라기보다는 4년전 만든 결과물에 애플의 음성비서 '시리(Siri)'같은 의인화 과정을 거친 모양새다.

영상은 등장인물이 터치스크린이 달린 기기에 그야말로 손가락 하나 까딱 않고 사진 크기를 조절하고 SNS에 올리는 과정을 담았다. 미래에 단순한 사진편집 시나리오는 이런 식이 될 것이라는, 어도비리서치의 비전으로 풀이된다.

■'시리'같은 대화형 음성비서, 사진편집에도 적용

지난 10일 어도비리서치가 유튜브에 게재한 영상은 한 남자가 태블릿 기기의 음성입력 인터페이스를 켜는 걸로 시작한다. 기기에서 흘러나오는 여성 음성은 "무엇을 도와드릴까요"라 묻는다.

어도비리서치가 2017년 1월 유튜브에 게재한 가상의 음성기반 이미지편집 시나리오 시연영상.

남자는 "이 사진 테두리를 정사각형으로 바꾸고 싶어요"라 말한다. 기기 화면의 직사각형이었던 사진은 가로세로 길이가 같은 정사각형으로 좌우가 잘린다. 이제 여성 음성은 "(가로세로 비율을) 1대1로요?" 묻고, 남자는 "그리고 좌우대칭으로 뒤집어요" 요구한다.

사진의 좌우가 뒤바뀌고, 여성 음성은 "(이렇게) 수평으로요" 말하며 확인을 구하자, 남자가 "아니, 원래대로 해줘요"라며 취소한다. 여성 음성은 뒤바뀐 좌우를 되돌리며 "그럴게요" 한다. 남자는 만족한듯 "좋네요" 말한다.

여성 음성이 "편집된 걸 저장할게요" 하자, 남자는 "페이스북에 올려주세요" 한다. 기기 화면에 포스팅이 됐다는 표시가 뜨고, 여성 음성이 "안녕히 계세요" 말하자 남자도 "안녕히 계세요" 말하며 영상이 끝난다.

어도비리서치 측은 유튜브 영상 소갯말에 "어도비리서치 팀은 지능형 디지털 비서의 사진편집이 어떤 모습이 될지 탐구하고 있다"며 "우리는 우리 고객들의 창조적인 작업과 영감에 대한 깊은 이해와 음성 상호작용의 과학을 '어도비 센세이(Sensei)'로 결합했다"고 밝혔다.

어도비 센세이는 어도비의 머신러닝 기술을 담은 서비스 플랫폼 브랜드다. 여기에 탑재된 어도비의 음성인식시스템이 영상에서처럼 기기 사용자의 자연어 명령을 직접 받아들여 이미지를 편집할 수 있게 해준다는 설명이다.

어도비리서치 측은 영상에 담은 시나리오가 "우리의 크리에이티브 고객이 어도비 모바일 애플리케이션(이하 '앱')을 사용해 쉽고 매력적인 방식으로 멀티모달 음성기반 인터페이스를 이미지 검색과 편집에 활용할 수 있게 만드는 첫걸음"이라고 덧붙였다.

아직 이 기술을 담은 상용 소프트웨어(SW)가 개발된건 아니다. 하지만 현시점 이후 어도비가 이런 기술을 품은 모바일 앱을 제품화하더라도, 더 이상 놀랍지 않은 일이 됐다.

■음성비서 이전의 음성기반 디지털편집, 4년전 연구에 힌트

영상 속의 편집 기능은 수작업으로 하더라도 그리 어렵지 않은 기초적인 수준이다. 그러나 영상을 소개한 온라인 IT미디어 더버지 측은 향후 어도비가 더 복잡한 이미지 편집 작업도 자동화할 것이라 쉽게 상상할 수 있다고 지적했다.

2013년 1월 유튜브에 게재된 어도비리서치 '픽셀톤(PixelTone)' 프로토타입 아이패드 앱 소개 영상의 한 장면.

[☞참조링크: Adobe is working on a voice-activated digital assistant that can edit pictures for you]

어도비리서치가 선보일 '더 복잡한 이미지 편집' 기술은 어떤 것일까? 실은 애써 상상할 필요가 없다. 이미 어도비리서치는 4년전에 고수준의 이미지 편집 작업에 음성 인터페이스를 활용하는 방안의 연구 성과도 '픽셀톤(PixelTone)'이라는 이름으로 선보인 적이 있기 때문이다.

픽셀톤은 지난 2013년 1월 역시 유튜브 영상으로 소개된 아이패드용 사진편집 앱 프로토타입이다. 앱은 사용자의 자연어 음성 및 터치 조작을 받아 사진의 채도, 색조, 밝기를 바꾸거나, 특정 방향으로 흐림 처리를 넣거나, 사용자가 지정한 영역의 명암 및 색상을 조절할 수 있다.

[☞참조링크: PixelTone: A Voice Controlled Photo Editing App for iPad]

4년전의 결과물 치곤 새로 공개된 유튜브 영상 속의 앱에 뒤떨어지지 않는, 오히려 더 고수준의 편집 기능을 지원한다는 점이 눈길을 끈다. 픽셀톤 프로토타입 앱은 어도비리서치와 미국 미시간대학교 정보대학(School of Information)이 공동연구한 결과물이다.

관련기사

영상을 확인해 보면 픽셀톤 프로토타입 앱은 음성과 터치 인터페이스를 복합적으로 사용한다는 걸 알 수 있다. 사용자가 음성으로 편집할 이미지의 특정 영역을 '학습'시켜 전체적인 의도를 입력하고, 터치스크린의 '슬라이더'를 건드려 미세한 변화 수준을 조절하는 식이다.

사진편집 기술면에서는 픽셀톤 쪽이 더 우월해 보이지만, 새로운 영상에서는 사용자의 요청에 대화하듯이 대응할 수 있다는 점이 눈길을 끈다. 향후 어도비리서치의 연구 결과물이 기존 픽셀톤 앱의 고급 기능도 음성 대화 방식으로 처리될 수 있을지 지켜볼 만하다.