MS "AI 발전할수록 인간의 독창성 존중하게 돼"

MS리서치아시아 소장 샤오우엔 혼 박사 특별 인터뷰

컴퓨팅입력 :2019/11/20 14:23    수정: 2019/11/21 08:27

강력한 기억력과 계산 성능을 갖춘 컴퓨터 덕분에 인공지능(AI)이 급속히 발전하고 있다. 일부 연구자들 사이에선 수년 내지 수십년 안에 인간의 능력을 뛰어넘는 '범용 AI'의 등장을 예견하기도 한다. 이미 수십년전 연구자들의 상상력과 실험실 이론에 그쳤던 AI 기술이 실제 구현 단계에 다가가거나 상용화됐다. 이런 정황은 뛰어난 AI가 대다수 평범한 인간의 능력을 무가치하게 만들 거란 비관론에 무게를 더한다.

최근 한국을 다녀 간 마이크로소프트(MS) AI 전문가의 생각은 좀 다르다. 이 전문가는 AI와 '인간지능(human intelligence)'의 상호의존적 발전, 즉 '공진화(coevolution)'를 제안했고, 이를 실현해 나가기 위한 MS의 노력과 전략을 강조한다. 지난 14일 지디넷코리아 '아시아 테크 서밋(ATS) 2019' 기조강연자로 참석했던 샤오우엔 혼(Hsiao-Wuen Hon) 박사의 견해다.

혼 박사는 ATS 2019 기조강연을 통해 '지능'의 다섯 층위와 MS의 AI 기반 디지털트랜스포메이션 전략을 제시했다. 지능 가운데 '창의력' 면에서 AI가 인간을 뛰어넘으리라 보긴 어렵지만, 기업은 AI로 더 나은 의사결정을 내려 고객에게 더 나은 가치를 줄 수 있고, MS는 이를 추구하는 기업의 파트너이자 그에 필요한 교육과 학습을 돕는 역할을 하겠다고 강조했다.

[ATS 2019 현장 키노트 기사 바로가기 ☞ MS "인간의 창의력이 '100'이라면 컴퓨터는 '0'이다"]

지디넷코리아는 이날 기조강연을 마친 혼 박사와 MS AI 기술과 비즈니스 전략을 주제로 심도 깊은 특별 인터뷰를 진행했다. 그는 인터뷰 질의에 답하면서 "AI 성과가 많이 나올 수록 인간의 독창성(ingenuity)에 대한 존경심을 갖게 된다"며, 여전히 "이 둘(AI와 인간지능)을 합치는 게 중요하다"고 주장했다. 2년전 지디넷코리아와 진행한 서면 인터뷰의 키워드 '공진화'의 핵심 개념을 재차 강조한 셈이다.

샤오우엔 혼 박사. 마이크로소프트 리서치 아시아 소장, 아태지역 R&D 총괄, 본사 기업부사장(CVP)이다. [사진=마이크로소프트]

인터뷰 자리에서 혼 박사는 AI와 인간지능 결합, 즉 공진화의 필수 조건으로 '데이터 거버넌스'를 꼽았다. 유럽 일반개인정보보호법(GDPR)이 그 선진 사례라고 평했다. MS 'AI 설계 원칙'의 세계 보편적인 가치를 함축하고 있지만, 이를 현실화하는 과정에는 현실의 상황과 개인이 품는 생각에 따른 차이가 있을 수 있다고 설명했다.

그는 MS의 최근 AI 연구 성과를 바탕으로 최근 불거진 '딥페이크(deepfake)' 기술 악용 문제를 해결할 수 있다고 기대했다. 장기적으로는 학생과 일반인 대상 교육을 통해 산업계에서 필요로 하는 역량의 수요공급 불균형도 해소할 수 있을 것이라고 내다봤다. MS 클라우드 기술의 효율과 이를 활용하는 기업, 개발자, 일반인의 생산성을 끌어올릴 수 있도록 비즈니스 조직과 협력하겠다고 예고했다.

혼 박사는 AI라는 용어가 대중적으로 널리 알려지기 훨씬 전부터 MS리서치 연구원으로 일해 왔다. 이제 MS리서치 아시아 소장, MS 아태지역 R&D그룹 총괄, 본사 기업부사장(CVP)으로 MS의 아시아지역 AI 연구를 총괄하고 고위 경영진과의 소통으로 비즈니스 전략을 지원한다. 지난주 MS의 'AI 및 리서치' 수장인 해리 셤 총괄부사장(EVP)이 내년 퇴사를 예고하면서, 그의 조직 내 위상은 더 높아질 것으로 보인다.

혼 박사와의 특별 인터뷰 내용을 일문일답으로 정리했다.

■ "AI에 데이터 풍부하지만 지능은 부족하다…인간지능과 합쳐져야"

- 2년전 인터뷰에서 인간과 기계의 공진화를 강조했는데, 여전히 같은 생각인가

"어릴 때 주산과 암산을 배웠지만 학교에서 익히는 팀(영재반)에 들진 못했다. '내가 똑똑하지 않구나' 싶어 크게 좌절했는데 고등학생이 돼서야 그 생각을 바꾸고 극복할 수 있었다. 이후 '지능'에 대한 내 생각은 계속 바뀌었다. AI 분야 연구 성과가 많이 나오면 나올수록, 인간의 독창성에 대한 존경심을 더 많이 갖게 된다. 알파고를 보면 물론 기계가 계산을 수행하지만, 그 속의 알고리즘은 모두 사람에게서 나온다.

물리학에는 '이론'과 '실험'이라는 두 측면이 있다. 이론물리 세계의 연구는 사람의 뇌에 의존하는 경우가 많다. 데이터가 아예 또는 거의 없는 상태로 만들어진다. 이론이 나오고 몇 년 뒤 실험을 통해 그걸 입증할 수 있게 된다. 우주의 '중력파'는 100년 전 아인슈타인이 이론적으로 예견한 존재를 몇 년 전에야 탐지할 수 있게 된 것이었다. 이를 통해 올해 들어 처음으로 우리가 '블랙홀'을 관측할 수 있게 됐다.

뉴턴 시대에도 천체와 관련된 많은 가설이 있었는데, 그걸 입증하기 위해 사용할 데이터는 거의 또는 전혀 없었다. 아인슈타인의 예측 이후 100년이 지난 지금 시대에도 인간에게 관련 데이터가 아주 많다고는 할 수 없다. 우리가 묘사하고 싶은 어떤 것(미지의 대상)이 있다고 할 때, AI엔 데이터가 많지만 지능이 적고, 인간지능은 데이터가 적지만 지능이 많기에, 이 둘을 합치는 것은 정말 중요하다.

아폴로 달 탐사선이 착륙한지 50년이 지났다. 인간이 달 탐사를 하기 위해 필요한 물리학 지식은 (그보다 훨씬 먼저) '아이작 뉴턴' 시대에 모두 나와 있었지만, 뉴턴에게는 컴퓨터가 없었다. 뭔가 발사하려면, 발사체의 각도와 추진력에 따라 그려지는 곡선이 아주 정확하게 계산돼야 정확하게 달로 떨어질 수 있는데 하나라도 틀어지면 달이 아니라 엉뚱한 장소로 간다.

1969년 '맨하탄 프로젝트'를 통해 컴퓨터 시뮬레이션이 가능해지면서 인류가 이를 계산하고 달 탐사를 할 수 있게 됐다. 뉴턴 시대에도 컴퓨터 없이 (발사 궤적을) 계산할 수 있었겠지만, 매우 많은 종이가 필요했을 테고, 사람이 실수할 가능성을 배제할 수 없었을 것이다. 사람에게 지능이 있더라도, 이를 현실 세계와 연결하고자할 때 컴퓨터의 연산 능력이 접목돼야 한다."

- 앞서 AI가 초래할 변화에 대비하려면 '데이터 거버넌스'가 필요하다고 했는데, 선진 사례가 있나

"GDPR을 시행한 유럽이다. GDPR에 포함된 '잊힐 권리'는 사람들이 사용하는 서비스나 애플리케이션을 제공하기 위해 그들의 데이터를 필요로 하지만, 당사자가 그걸 '더 이상 안 쓰겠다'고 결정하면 제공업체가 그와 관련된 모든 데이터를 삭제하도록 만든다.

많은 이들은 이를 합리적이라 여긴다. MS는 글로벌 기업으로서 이를 따르기로 했다. GDPR은 유럽의 규정이지만, 유럽인에게만이 아니라 전세계인에게 적용된다고 생각하고 준수하고 있다.

세계 곳곳은 서로 연결돼 있고 글로벌화가 진행된 시대이며, 유럽인이 전세계 어디에든 자리잡고 지낼 수 있기 때문이다. 앞으로 GDPR의 잊힐 권리가 범세계적 제도로 채택될 것이라 확신한다. 한국 정부와 관련 부처도 이에 관련해 심사숙고 중이 아닐까 싶다."

■ "조작 이미지 가려내는 기술 연구 중…딥페이크 문제 해결 가능"

- AI 연구를 통해 해결할 수 있다고 보는 사회문제가 있다면

"장기적인 것과 단기적인 것으로 나눠 얘기해 보겠다. 먼저 장기적으로. 기술을 소유한 사람이 경쟁우위를 점하고, 승자가 되고, 모든 것을 가져가는 것을 떠올리긴 쉽다. 하지만 기술을 통해 우리가 해야 할 일은, 일반적으로 혜택을 덜 받는 사람을 돕는 것이다. 소득 격차와 같은 문제를 기술로 해소할 수 있지 않을까 싶고, 가장 중요한 것은 교육 분야라고 생각한다.

초등학교, 중학교, 고등학교, 대학교, 평생교육, 모두 기술을 통해 개선할 수 있을 것이다. 교육은 어떤 사람의 경쟁력을 높이는 걸 돕기도 하고, 그가 일자리를 얻기 위한 스킬을 구축하는 데 근간이 되기도 한다. 채용이 기업의 일방적인 절차에서 앞으로 그 회사가 필요로 하는 스킬을 갖춘 사람이 능동적으로 매칭하는 방식도 장기적으로 반드시 가능해질 것이라 기대한다.

단기적으로 해결할 수 있을 것이라 보는 건 '딥페이크(deepfake)' 기술로 인한 문제다. 딥페이크는 많은 이들이 일어나지 않은 일을 일어난 것으로 믿게 만드는 문제를 만들고 있다. 딥러닝 기법으로 (영상과 음성을 조작해) 누군가 말하지 않은 것, 행하지 않은 것을 벌어진 일처럼 보이게 만든다. 이 기술이 너무 다루기 쉬워져서, 일반인 누구나 깃허브에 올라온 코드를 내려받아 아주 쉽게 쓰는 양상이 벌어지고 있다.

누군가에게 영상과 사진이 제공됐을 때, 우리는 그게 조작됐을 가능성을 점수화하는 분류기(classifier) 기술을 개발했다. 초기 기술로 딥페이크 이미지를 분류한 결과, 생성 결과물을 학습한 대상 이미지의 판정시 99%대의 정확도를 보였다. 하지만 아예 생성 결과물을 접한 적 없는 이미지의 판정 정확도가 매우 낮았다. 이처럼 학습 안 된 이미지를 처리한 결과가 좋지 않은 게 기존 딥러닝 분류기 기술의 약점이었다.

딥페이크가 하는 일은 간단히 설명하자면, 어떤 이미지 속 인물의 얼굴 부분을 오려내서 다른 쪽 이미지의 인물에 조금씩 당기고 늘려서 그럴듯하게 맞추는 거다. 이런 공통점에 집중해, 현재 개발중인 분류기 기술은 학습하지 않은 이미지로도 상당한 판정 정확도를 보여 준다. 향후 개발될 알고리즘의 결과물을 접하더라도 100%는 아니지만 더 나은 결정을 내릴 수 있도록 도울 수 있는 고무적인 성과다."

샤오우엔 혼 박사가 14일 특별 인터뷰 자리에서 딥페이크의 원리를 설명하고 마이크로소프트 리서치가 연구 중인 딥페이크 조작 이미지 판별 기술의 성능을 소개했다.

- AI 설계 원칙에서 '윤리'에 다양한 지역의 문화적 차이를 함께 검토하려면 어떤 방식이 효과적일까

"세계 각지에서 제시되는 AI 원칙은 서구의 것과 중국의 것이 그리 다르지 않다. MS의 (각국의 법제와 주권 존중을 기반으로 책임성, 투명성, 공정성, 신뢰성 및 안전, 포용성, 프라이버시 및 보안을 포함한) 원칙 또한 사회적으로 모두 공감할 수 있는 근본 요소들을 담고 있다.

누군가 의도하지 않았더라도 나쁜 결과를 빚었다면 책임을 진다. 투명성을 위해 기업은 분기별 실적 공시를 하고 정부는 CCTV같은 감시 기술 사용시 공공장소에 고지한다. 공정함은 현실에서 쉽지 않지만 어떤 기업과 정부도 '관심 없다'고 말하지 않는다. 신뢰성과 안전도 마찬가지다.

포용성은 어떤 국가나 환경에서든 존재하기 마련인 소수자를 끌어안는 것이다. 소수자의 데이터는 상위집단보다 부족하기 마련이고 그러면 정확도가 떨어진다. 모든 기업은 이런 소수자를 포용하는 걸 목표로 삼을 거라 생각한다.

휠체어 사용자가 어떤 장소로 이동할 수 있게 만드는 법이 있듯 '접근성(accessibility)'도 포용성의 일부다. 시각장애와 청각장애가 있는 이들에게 접근성을 제공해야 한다는 것에도 모두 공감할 것이다.

프라이버시에는 지역, 문화간 공감 수준이 다를 수 있다는 견해가 있는데 난 그보다 '개인차'가 크다고 생각한다. 공공안전을 고려해 감시카메라를 더 놓을지, 정부의 감시를 억제하고 프라이버시를 보호하기 위해 제한할 것인지의 문제다. 둘의 균형을 맞추는 것이 중요하다.

프라이버시와 안전 원칙을 현실에 구현할 땐 지역이나 문화에 따른 차이가 있을 수 있다고 본다. 어떤 앱을 쓸 때 나와 관련된 데이터를 앱이 많이 갖고 있을수록 그게 내게 필요한 서비스를 더 많이 제공할 수 있지만 프라이버시 이슈가 생길 수 있다. 역시 균형이 필요하다."

■ AI 구축 및 운영 기반인 클라우드 기술 효율화와 비즈니스 전략도 고민

- 본사 고위 임원으로서, 사티아 나델라 CEO에게 AI 동향 중 어떤 부분에 주목하라고 조언하고 있나

"그는 이미 많은 걸 알고 있고, '성장하는 마인드셋'을 중시한다. 그래서 언제나 우리에게 '모든 것을 다 알 수는 없지만, 모든 것을 배울 수 있다'고 말하곤 한다. 조언이라기보다 정보를 제공하는 차원에서, 미래 기술 동향과 지역별 고객 및 파트너 접근, 두 가지로 얘길 나눈다.

첫째 미래 기술 동향 주제로는, 내가 기술 분야에 오래 종사해 온 연구원으로서 향후 5년, 10년, 20년에 걸쳐 기술이 앞으로 어떻게 변화할지, 기초기술과 관련된 연구 방향이 어떻게 나아갈지, 이 두 가지 측면에서 많은 대화를 나누고 있다.

둘째로 나는 아시아태평양지역 R&D 총괄이자 MS리서치 아시아 소장으로서 이 지역 관련 현안에 관한 많은 얘기를 전한다. AI원칙, 윤리라는 큰 틀에 담긴 가치는 공통적이더라도, 현실에서 아태지역과 다른 지역을 비교할 때 잘 보이지 않는 차이가 분명 존재한다.

예를 들어 아태지역에선 어떤 AI 기술이 널리 쓰이는데 다른 어떤 지역은 무슨 기술이 더 인기를 끈다든지. 또는 동일한 AI 원칙을 구현하려는데, 서구에서 하는 것과 한국 또는 아태지역에서 하는 것이 달라지게 만드는 독특한 부분이 있을 수 있다."

- 클라우드 트렌드에 맞춰 회사 AI 전략을 어떻게 실행할 수 있을까

"우리는 '클라우드 퍼스트' 시대에 살고 있다. AI 관련해 클라우드 쪽이 우리에게 아주 중요한 제품군이다. (AI를 활용하기 위한) 플랫폼의 일부가 될 것이기 때문이다. 앞으로 클라우드로 많은 기술이 이전되고, 많은 문제를 해결할 수 있을 것이다.

기업들이 앞으로 클라우드를 어떻게 더 효율적으로, 효과적으로 운영할 것인지가 매우 중요하다. MS는 클라우드 분야 주요 경쟁사 두 곳이 보유한 걸 합친 것보다 많은 데이터센터를 가졌다. 우리가 이를 어떻게 완전하게 활용하면서도 비용 절감을 이룰 수 있을지가 관건이다.

또 아주 흥미로운 분야는 데이터다. AI는 반드시 데이터를 필요로 한다. 새로운 DB 시스템이라든지, 확장 가능한 정형 및 비정형 데이터라든지, 데이터를 처리하는 흥미로운 또 하나의 방식인 블록체인, 이런 기술도 중요한 분야가 될 것이다."

- MS의 클라우드 및 AI 분야 비즈니스 그룹과 어떻게 협력해 나갈 계획인가

"내부적으로는 클라우드를 'AI 슈퍼컴퓨터'라고 부른다. 그만한 연산 성능이 필요하기 때문이다. AI 학습과 인지 작업을 위해 더 비용이 저렴한 연산 기술을 제공할 방법을 생각하고 있다. AI는 수많은 CPU와 GPU를 사용하는 연산 기술 측면에서 상당히 높은 비용을 요구한다.

관련기사

사내 조직, 외부 기업, 일반인뿐아니라 개발자들의 생산성을 높일 방안도 모색한다. 그간 개발자에게 비주얼스튜디오 개발툴로 생산성을 높이도록 도왔듯이, 프로그래머빌리티(programmability) 영역에서 AI로 개발자들이 어떻게 생산성을 높이도록 도울까 고민한다.

새 프로그래밍 모델을 만들어줄 수 있을까 연구한다든지, (AI 개발 코드 가운데) 비즈니스 로직과 프리젠테이션 로직이 각각 존재하던 개발 환경을 통합적으로 제공한다면, 개발자와 AI 전문가들이 좀 더 생산적으로 일하지 않을까 생각하기도 한다."