---------------------------------------*글 싣는 순서1)구글CEO도 흥분시킨 머신러닝의 세계 2)머신러닝이 몰고올 IT 진화 시나리오 3)머신러닝, 제대로 쓰기 위한 3가지 키워드---------------------------------------래리 페이지 구글 최고경영자(CEO)는 올해 3월 TED강연에서 머신러닝을 "오랫동안 보아온 것 중에 가장 흥미로운 기술"이라고 말했다. 구글이 머신러닝 스타트업 딥마인드를 5억 달러에 인수한 직후 나온 얘기였다.
구글은 2012년 구글 브레인 프로젝트통해 자랑할 만한 머신러닝 연구 성과를 내놨다. 컴퓨터가 유튜브에서 스스로 고양이 이미지을 찾아낸건 이제 꽤 유명한 이야기가 됐다.
1만6천 중앙 프로세싱 유닛을 갖춘 구글 슈퍼컴퓨터는 유튜브에서 공유된 많은 이미지가 유사한 캐릭터를 가지고 있다는 사실을 알았고 결국 그 캐릭터를 고양이로써 인식해 냈다. 이미지에 고양이를 인식할 수 있는 어떤 표시도 없었다는 점에서 많은 이들의 놀라움을 자아냈다.
구글 검색의 기본 원칙인 페이지링크도 텍스트마이닝이라는 일종의 머신러닝 기술이다. 머신러닝은 개인 비서 서비스인 구글 나우에 담긴 음성 인식의 정확도 높이는데도, 유튜브에서 영상을 추천하는 알고리즘에도 쓰인다.
머신러닝 레이스에 뛰어든 건 다른 IT 공룡들도 마찬가지다. 페이스북은 이 분야 최고 권위자로 꼽히는 미국 뉴욕대 얀 레쿤(Yann LeCunn)교수를 인공지능연구소(AI랩) 수장으로 영입했다.
페이스북 연구원들은 딥러닝 기술을 얼굴 인식에 사용하고 있다. ‘팬더’라고 불리는 프로젝트를 통해 사진에서 정확하게 인물의 성별, 헤어스타일, 옷 스타일, 얼굴 표정을 식별하는 방법도 연구하고 있다. 이런 종류의 연구는 페이스북이 사진을 태그하는 성능을 높이고 타게팅된 광고를 제공하는 능력을 향상시키는데 활용되고 있다.
지난 8월 마크 저커버그 페이스북 CEO는 ‘뉴럴 인포메이션 프로세싱 시스템 컴퍼런스’에 등장했다. 이 컨퍼런스는 어떻게 컴퓨터가 사람처럼 배우게 할 것인가에 대해 논의 하는 자리다. 그는 컨퍼런스에서 “페이스북은 사람들이 공유하는 모든 콘텐츠를 더 잘 이해하기 위해 AI에 접근하는 새로운 방법을 찾고 있다”고 말했다.
세계 최대 비디오 스트리밍 업체 넷플릭스는 사용자의 구매이력을 바탕으로 영화를 추천해 주는 서비스에 머신러닝을 적용하고 있다. 넷플릭스는 최근 머신러닝 콘테스트를 열고 구매이력 샘플을 바탕으로 가장 잘 예측한 팀에게 100만 달러 상금을 수여하기도 했다.
야후와 트위터는 각각 이미지 인식에 특화된 머신러닝 기술을 가진 룩플로우(LookFlow)와 매드비츠(Madbits)를 인수했다. 비전이라고 불리는 머신러닝을 이용한 이미지 인식 기술은 미디어 파일에 태그가 없어도 관련 정보를 자동으로 이해하고 구성하고 추출할 수 있다.
전문가들은 야후나 트위터에 올라오는 이미지 양이 엄청나다는 점을 생각하면 이런 인수는 놀랄 일이 아니라고 입을 모은다. 이들 업체는 머신러닝 기술을 기반으로 이미지 검색 기능을 출시할 수도 있고 사람들이 올리는 콘텐츠가 무엇인지도 보다 잘 이해하고 분석할 수 있다. 드롭박스, 핀터레스트도 이미 컴퓨터 비전 영역 회사들을 인수한 바 있다.
IBM은 슈퍼컴퓨터 왓슨을 통해 딥러닝 분야를 연구하고 있고 MS도 아담이라는 슈퍼컴퓨터 프로젝트를 진행중이다.
MS는 애저 클라우드에도 머신러닝을 활용한다. 데이터센터 확장이나 상면 할당, 메모리 할당 같은 부분을 무턱대고 확장할 수는 없으니, 리소스를 3개월 이내 얼마나 투자할 지 머신러닝으로 예측한다. MS는 클라우 기반 머신러닝 서비스도 공개하는 등 머신러닝에 쏟아붓는 실탄을 계속 늘리는 모습이다.
■머신러닝, 어디까지 발전할까?
과도한 낙관론은 위험하다하지만 구경꾼 입장에서 머신러닝과 IT서비스와 사람들의 삶에 어떤 변화를 몰고올지 궁금해 지는건 어쩔 수 없다. 스스로 학습하는 기계라는 개념은 이런저런 상상으로 이어지게 마련이다.
네이버 랩스 김정희 수석연구원은 머신러닝 기술이 발전하면 결국엔 컴퓨터가 사람 같은 눈과 귀를 가지게 될 것으로 내다봤다.
“가까운 미래에는 구글 글래스 같은 걸 끼고 바라만 봐도 제품 브랜드는 뭐고 얼마에 팔고 있는지 어디가면 싸게 살 수 있는지 등을 알 수 있을 것 같아요. 또 글자를 이미지로 인식해서 영어로 바꿔 줄 수도 있어요. 이런 서비스는 이미 프로토 타입으로 나오기도 했습니다.”
그는 머신러닝 기반 이미지 인식이 로봇에 적용되면 로봇이 이미지를 통해 주변 사물을 인지하고 뭔가 행동를 할 수 있게 구현할 수도 있다고 설명했다.
이미지뿐 아니라 음성이나 음악인식쪽의 변화도 기대해 볼만 하다. 아마존이 파이어폰을 공개하면서 함께 선보인 파이어 플라이라는 서비스는 이미지뿐만 아니라 주변 소리를 인식해서 영화, 음원 등의 상품을 보여준다. 아마존은 에코(Echo)라는 음성인식 기기도 출시했다. 에코는 사용자의 음성을 인식하고 거기에 맞는 정보를 제공하거나 기능을 제공한다.
음성 인식이 발전되면 자동 통역기도 나올 수 있다. 실제로 MS는 스카이프에 이런 자동 통역기능을 추가하기도 했다.
추천 서비스도 머신러닝을 통해 빠르게 진화할 것으로 보인다. 페이스북이나 트위터 같은 SNS에 올린 사진을 기반으로 개개인이 어떤 스타일의 옷을 입었는지 컴퓨터가 이해하고 새로운 옷을 추천해 줄 수도 있다.
김 수석연구원은 “초보적이지만 네이버도 N드라이브로 처음 딥러닝 스타트를 끊은 것이고 우리도 좀더 발전된 서비스로 나가야 한다”고 말했다.
한국MS 이건복 이사는 데이터가 다량으로 발생하고 미래를 예측할 수 있는 분야에선 모두 머신러닝이 활용될 수 있을 것으로 전망했다.
이 이사는 런던지하철에서 머신러닝을 활용한 케이스를 소개했다. 그에 따르면 영국은 런더지하철 역사와 지하철 철로에 있는 센서에서 데이터를 취합해 클라우드로 보내고 머신러닝을 돌려서 부품 교체 수명이나 열차 안 온도 등을 예측하는데 활용하고 있다고 한다. 예측 정보는 즉각 역무원 및 직원들에게 모바일로 전송되 이들이 적절한 조치를 취하게 된다. 이 이사는 런던지하철 사례와 마찬가지로 “사물인터넷(IoT), 빅데이터, 클라우드, 머신러닝, 모바일이 모두 결합된 서비스가 나올 것”이라고 전망했다.
■“머신러닝, 환상보단 현실적으로 바라봐야”
머신러닝을 연구하는 사람들이 궁극적으로 바라고 목표하는 서비스는 영화 허(Her) 같은 모습일 것이다. 하지만 금방 이런 인공지능이 나올 것 같은 환상은 금물이다. 기대보다 성과가 빠르게 나타나지 않을 경우 거품은 꺼지고, 대한 기업들의 작은 지원마저 끊길 수 있다. 이미 머신러닝은 한차례 파고를 겪었다. 머신러닝은 1980년대 한차례 붐을 일으켰다가 깊은 침체를 겪은 역사가 있다. 1980년대 머신러닝,좁게는 딥러닝이 각강받았던 당시 인공지능 기술은 다 완성돼 당장이라도 터미네이터 같은 로봇을 만들 수 있을 것처럼 환상을 일으켰다. 그러나 결과는 일반 대중을 만족시키기에 부족했다. 정가 연구 당사자들은 원래 그랬다고 항변했음에도 대중은 실망을 하고 머신러닝 자체에서 시선을 돌려 버렸다.
김정희 네이버랩스 수석연구원은 언론에서도 환상보다는 현실적으로 접근해 줄 것을 주문했다.
“과거가 되풀이되면지 않기를 바랍니다. 확 떴다 훅 가서 아무도 연구를 안 하는 상황이 또 오면 안 되잖아요. (머신러닝은) 꾸준한 관심과 평정심이 필요합니다.적절한 수준에서 기대를 갖고 지켜봐 줬으면 좋겠어요.”
관련기사
- 구글 CEO도 흥분시킨 '머신러닝'의 세계2014.12.14
- 머신러닝, 제대로 쓰기 위한 3가지 키워드2014.12.14
- 시만텍 "내년 보안 키워드는 'IoT'와 '머신러닝'"2014.12.14
- 구글, 옥스포드大 머신러닝 전문가 대거 영입2014.12.14
그렇다면 지금 시점에서 기업들은 머신러닝을 어떻게 바라봐야 할까? 모든 기술기반 서비스 업체라면 머신러닝에 관심을 가지고 투자해야하는 것일까? 아니면 구글이나 페이스북, 적어도 국내에선 네이버 정도는 돼야 할수 있는 일이 머신러닝이라고 보고 당분간 지켜봐야 할까?
3편 머신러닝, 제대로 쓰기 위한 3가지 키워드에서 계속 ☞바로가기