머신러닝, 이러다 미신러닝 될라

[연말기획①] 머신러닝을 어떻게 볼 것인가

컴퓨팅입력 :2015/12/23 11:03    수정: 2015/12/27 13:11

김우용, 임민철, 임유경 기자

머신러닝이 대세를 제대로 탔다. 미디어는 연일 인공지능으로 가득한 꿈 같은 세계를 조망한다. 주식시장엔 벌써 ‘머신러닝 테마주’도 나타났다.

빅데이터 전문 회사에서 머신러닝 및 인공지능 전문 회사로 간판을 바꿔 달고 나와 주가를 높이는 업체들도 있다. ‘머신러닝 3개월 완성 코스’, 머신러닝 회사를 자처하는 기업의 이익단체 ‘머신러닝 협회’가 나오는 것도 시간 문제로 보인다.

그런데 좀 이상하다. 뜬다 뜬다 하는데 머신러닝을 제대로 아는 사람을 만나는 건 매우 어렵다. 오랜 시간 인공지능 관련 분야에 종사해온 사람들은 오히려 겸손하다. 머신러닝에 대한 환상이 지나치게 퍼져간다며 걱정하는 분위기도 강하다.

투자가 대규모로 이뤄지고, 세계의 우수한 인재들이 뛰어드는 상황이니 머신러닝이 우습게 볼 존재는 아닌 듯하다. 새로운 트렌드가 뜨면 일정 수준의 요란함이 뒤따르는 것은 불가피한 측면도 있다.

현실과 동떨어진 메시지들이 과도하게 유통되는 것은 지금부터 확실하게 경계할 필요가 있다는게 머신러닝 현장 전문가들의 지적이다.

------------------------------------------------------------

[글 싣는 순서]

①머신러닝, 이러다 미신러닝 될라

②머신러닝, 못 한다고 전해라

③머신러닝은 툴이다

------------------------------------------------------------

■당신이 생각하는 인공지능은 없다

구글, 마이크로소프트(MS), 페이스북 등 잘나간다는 회사가 정신 없이 머신러닝 얘기를 쏟아내는 가운데, 인공지능이 각광받고 있다.

머신러닝을 '스스로 학습하는 컴퓨터' 혹은 ‘인공지능’이라 여기는 막연한 환상이다.

머신러닝은 인공지능인가?

인공지능을 무엇으로 보느냐에 대한 견해는 다양하다. 하나를 가르쳐 주면 둘, 셋을 알아내는 확장성을 가져야 인간 지능을 모방한 ‘인공’ 지능이라고 말하는 학자도 있다. 반면 강한 AI와 약한 AI로 나눠 봐야 한다는 의견도 있다. 스스로 진화하는 것이 강한AI라면, 이미지, 음성, 텍스트 등을 인식해 정해진 일을 처리하는 건 약한 AI다. 이 기준에 따르면 머신러닝은 약한 AI에 속한다.

인공지능은 인간이 세운 원대한 목표다. 인공지능을 만들기 위해 학파마다 수많은 방법을 고안했다. 머신러닝은 인공지능을 만드는 방법론 중 하나다.

네이버 김정희 연구원은 "인공지능은 우리가 풀려는 ‘문제’고, 머신러닝은 그 문제를 풀기 위한 하나의 방법론이다. 데이터 주도적으로 인공지능을 한번 만들어보자는 것이다. 인공지능으로 가기위한 다른 방법론들도 있지만 지금 상황에서 가장 좋은 성능을 내고 있는 것이 머신러닝이고, 그 중에서도 딥러닝이다”고 설명했다.

머신러닝이 발전하면서 인공지능을 구성하는 다른 요소에 깊숙이 영향을 주는 상황이다.

페이스북 머신러닝 그룹을 운영하는 이동윤 씨는 “인공지능을 이루는 조건은 움직임과 조작, 감지, 커뮤니케이션, 연역적 추론과 문제해결, 계획세우기, 지식 표현 등 7가지인데 과거에는 이 중 감지 부분이 머신러닝을 이용해 주로 해결할 수 있는 영역이었다면 지금은 움직임을 제어하거나 커뮤니케이션하는 부분까지 머신러닝이 많이 관여하고 있다”고 설명했다.

정리해 보면 머신러닝, 그 중에서도 딥러닝이 인공지능 구현 방법 중 가장 좋은 성과를 내면서 인공지능 분야에서 딥러닝 대세론이 힘을 받고 있다. 지금 이 시간 인공지능을 만들기에 가장 우수하다고 여겨지는 방법론이 머신러닝, 그중에서도 딥러닝이다. 이점이 인공지능과 머신러닝을 동의어처럼 쓰게 만들었고, 오해를 빚어내고 있다.

머신러닝과 인공지능을 동의어처럼 쓴다고 해도 머신러닝이 모든 문제를 해결해 주지 않는다. 머신러닝은 잘 할 수 있다고 평가받는 분야에서도 아직 미흡한 점이 많다. 구글의 사진 자동 분류 서비스 구글포토가 흑인 여성을 고릴라라고 인식해 논란을 빚었던 게 그 예다.

전문가들은 머신러닝이 스스로 학습하는 컴퓨터라고 하지만 사람이 정답을 찍어주는 것이 여전히 중요한 요소라고 이야기 한다. 전문용어로 '지도적 학습’ 또는 '감독적 학습’이 필요하다.

김정희 연구원은 “사람이 답을 알려주는 것과 스스로 학습하는 것이 결합되어야 한다. 사람도 아이가 고양이를 알아갈 때 처음엔 길고양이도 보고 그림책의 고양이도 보면서 비슷한 것 같다고 느낄 때 엄마가 이것들이 고양이라고 얘기해 주면 어떤 고양이가 나와도 알아낼 수 있는 것과 같다. 근데 이때 또 치타나 표범 같이 비슷하지만 세밀한 구별 필요한 대상은 답을 일일이 알려 줄 수 밖에 없다.”고 설명했다.

그는 또 "지금은 머신러닝을 지도적 학습, 감독적 학습을 해야 한다. 풀려는 문제가 이거고 그 정답은 뭐다 라는것을 알려 줘야 한다는 말이다. 강한AI로 가기까지는 갈 길은 멀다.”고 덧붙였다.

다시말해 우리가 기대하고 상상하는 아이언맨의 자비스나 허(her)의 OS1 같은 인공지능은 없다. 앞으로 한참은 아마 구경하기 어려울 것이다. 학계는 ‘인공지능이 인공지능을 만들어낼 때’를 진정한 인공지능의 완성이라 본다.

머신러닝이 계속 발전하다 보면 강한AI로 발전할까? 현업의 머신러닝 전문가들은 "약한AI로도 안 풀리는 문제가 허다한데 강한AI를 논하는 것은 너무 거대 담론 아니냐”고 되묻는다.

■머신러닝이 뜬다?

실제 머신러닝은 글로벌 IT회사들이 가장 주목하는 기술이다. 이들은 수년 전부터 머신러닝 드리븐(주도적) 회사로 DNA를 교체했다. 구글의 무인 자동차가 차선과 신호를 구분하고 사람을 피해 정지할 수 있는 것도, 페이스북이 친구 얼굴을 찾아 정확하게 태깅할 수 있는 것도, 넷플릭스가 개인 취향에 딱 맞는 영화를 추천해 줄 수 있는 것도 모두 머신러닝 기술 덕분이다.

하지만 단순히 ‘뜬다’는 프레임으로 머신러닝을 바라보다가는 헛다리만 짚을 가능성이 크다. 머신러닝은 기존 서비스를 훌륭하게 개선해줄 좋은 툴이지만 그렇다고 모든 회사가 구글, 페이스북 같은 머신러닝회사가 될 필요는 없기 때문이다.

지금의 분위기는 한국에선 소위 ‘뜬다’는 수식을 달았던 다른 기술들처럼 머신러닝에도 거품이 생기는 모습이다.

학계에서도 핀트가 어긋난 관심은 오히려 고민거리다. 인공지능의 시작은 1956년이다. 초창기 엄청난 기대를 모았던 인공지능 개발 시도는 실망스러운 결과만 냈다. 인공지능은 1974년부터 1980년사이 1차 침체기를 겪는다. 침체기를 거쳐 새로운 방법론이 연구됐지만, 실패하고 말았다. 인공지능은 1987년부터 2차 침체기를 맞는다. 2차 침체기 이후 머신러닝과 딥러닝이 인공지능 개발 방법론으로 효용성을 증명한 최근까지 깊은 침체를 겪어야 했다.

학계는 이 침체기를 'AI 윈터’라고 부른다. 당장이라도 터미네이터 같은 로봇을 만들 수 있다는 환상이 원인이었다. 거품이 꺼지자, 연구 지원이 끊겼고 관련자는 힘든 시기를 보냈다. 그러다 인공지능과 머신러닝 대신 새 길을 찾아 떠난 사람이 부지기수다.

현업 종사자와 연구자들은 다시 겨울을 맞게 될까 걱정하고 있다. 세계적인 인공지능학술대회는 머신러닝의 재도약 시기를 맞아 ‘제3의 AI 윈터를 막아야 한다’며 세미나를 열 정도다.

머신러닝에 대한 지나친 환상이나 ‘뜬다'식의 관심은 경계해야하지만 반대로 ‘우리와 상관 없는 이야기’라고 보는 무관심도 옳지 않다. 머신러닝 전문가들은 “앞으로 머신러닝 기술이 서비스의 품질을 좌우하는 데 더 중요해 질 것이기 때문에 많은 기업들이 머신러닝을 활용할 수 있어야 한다”고 강조했다. 머신러닝은 많은 기업들의 핵심 역량의 레벨을 바꿔 놓을 수 있는 중요한 기술이다. 다만 어떻게 접근하느냐가 관건이라는 얘기다.

2편에 계속...

------------------------------------------------------------

[글 싣는 순서]

①머신러닝, 이러다 미신러닝 될라

②머신러닝, 못 한다고 전해라

관련기사

③머신러닝은 툴이다

------------------------------------------------------------

김우용, 임민철, 임유경 기자yong2@zdnet.co.kr