머신러닝, 못 한다고 전해라

[연말기획②] 머신러닝을 어떻게 볼 것인가

컴퓨팅입력 :2015/12/23 11:03    수정: 2015/12/23 11:08

김우용, 임민철, 임유경 기자

‘머신러닝이 그렇게 좋다며? 그거 하려면 뭐 해야돼?’

머신러닝은 IT 업계 역대급 신기루다. 그게 뭔지 정확히 모른 채로 다가가면 다가갈수록 화를 입기 십상이다. 신중하게 접근해 그 가치를 제대로 이해해야 한다.

머신러닝은 문제를 푸는 최신 IT 도구다. 오랜 문제 해결을 돕거나, 예전엔 엄두도 못냈던 문제를 풀려는 시도를 가능케 하다 보니 세간의 관심과 기대를 받는다. 기업이 이 배경을 학문적으로 분석하면 번지수를 잘못 찾은 것이다.

기업이 머신러닝을 ‘할 때‘가 아니다. 머신러닝을 ‘써야 할 때’다. 그것도 아주 잘 활용해야 한다. 어떤 회사든 활용을 위해 머신러닝 자체를 면밀히 파악해야겠지만, 그 기술자체를 만들겠다고, 말 그대로 ‘머신러닝을 하겠다’고 덤벼선 곤란하다.

------------------------------------------------------------

[글 싣는 순서]

①머신러닝, 이러다 미신러닝 될라

②머신러닝, 못 한다고 전해라

③머신러닝은 툴이다

------------------------------------------------------------

시스템통합(SI) 사업자라면 고도화된 기술 확보 자체를 목표로 삼을 수도 있다. 하지만 SI 비즈니스모델로 삼기엔 머신러닝을 둘러싼 제반 산업 여건이 취약하다.

머신러닝을 활용 중인 어느 온라인서비스 운영업체 대표는 “머신러닝 기술로 SI사업을 하려면 최소 딥러닝이나 인공지능(AI) 박사과정 인력 5~6명으로 구성된 팀을 갖춰야 한다”며 “그런 인력이 쉽게 나오진 않고, 기업에서 그런 사람들을 잘 쓸지도 의문이라 (사업 성립이) 어렵지 않을까 싶다”고 말했다.

이 회사는 머신러닝 알고리즘과 플랫폼보다 서비스 자체에 더 많은 인력을 배정하고 있다. 중요한 건 머신러닝을 얼마나 열심히 쓰느냐가 아니라 어찌됐든 서비스를 잘 돌아가게 하는 것이기 때문이다.

사업자들이 트렌드에 대응하겠다고 일단 머신러닝 기술을 확보하겠다는 식의 접근은 바퀴를 재발명하겠다는 격이다. 정반대 양상을 띠지만 ‘머신러닝에 대한 몰이해’라는 공통분모에서 출발하는 2가지 부작용을 점칠 수 있다.

■묻지마 머신러닝 최악 시나리오 2가지

머신러닝이란 바퀴를 재발명하기로 목표를 세운 회사를 상상해보자.

소프트웨어(SW) 개발에 잘못된 인식을 가진 회사 경영진이 이런 함정에 빠지기 쉽다. 이런 경영진은 십중팔구 프로그래밍을 하찮은 일로, 개발자를 하찮은 일을 하는 사람으로 생각하거나, 반대로 SW개발은 매우 어려운 일이라 여기지만 그 전문가인 개발자에게는 손쉬운 일이라고 보는 경향이 있다.

이런 조직은 그 보유 지식과 경험이 어떻든간에 일단 개발자를 불러 ‘지금부터 머신러닝 합시다, 머신러닝 기술을 만들어내시오’라고, 종용할 게다. 기업 내부에 소속된 개발자든, 외주를 받는 SI 개발자든 과업을 수행해 결과를 내놓으란 식이다. 하지만 개발자가 지시에 따르더라도 경영진이 기대했거나 조직에 실질적으로 유익한 결과물은 안 나온다. 이런 사업은 ‘폭망’한다.

구체적인 달성 과제 없이 그저 머신러닝을 목표삼는 접근 자체가 실패를 부르는 출발점이다. 머신러닝을 나와라 뚝딱 외치며 휘두르면 보물을 턱 쏟아낼 도깨비 방망이쯤으로 인식한 댓가가 실패를 낳는다.

무지에서 비롯한 기술에 대한 환상은 새로운 일이 아니다. IT업계 핵심 키워드로 인구에 숱하게 회자된 클라우드컴퓨팅이나 빅데이터 역시 그 다음을 얘기하지 않고 기술을 도입하는 것 자체를 목표했던 많은 기업들에게 언제나 실패의 쓴맛을 안겼다.

이런 조직의 경영진은 개발자의 무능을 탓하며 결과의 책임을 떠넘길 게 아니라 스스로 부끄러워 해야 할 일이다. 기술을 쓰면 어디서나 바로 성과가 나올 것으로 기대하는 습성을 버려야 한다.

정반대로, 아무 일도 벌어지지 않을 수도 있다. 머신러닝이 분명 뜨거운 감자인데도 마치 거기에 아무 실체가 없는 양 무관심하게 행동하는 이들도 있을 수 있다는 얘기다.

개발자들이 머신러닝에 관심을 끊는다면 어떤 배경이 작용해서일까. 개발자들의 직무 성격과 현업 환경 특성을 고려하면 다음과 같이 예상할 수 있다.

대다수 기업내 현업 개발자의 전문성과 역량은 머신러닝과 무관하다. 머신러닝은 개발자에게 새로운 분야다. 머신러닝이 데이터와 분석에 깊이 연관되므로, 전통적인 SW 개발을 주로 해왔다면, 쉽게 접하기 힘들다. 학습곡선이 큰 부담으로 다가올 수 있다. 현업에서 정해진 기일 내 과업을 완수해야 하는 개발자는 빡빡한 일정에 맞추는 것도 벅차다. 새로운 분야를 차분히 공부해 도전하려는 마음을 품기 힘들다.

이런 상황에서, 경영진이 가상시나리오처럼 머신러닝에 꽂혀 뭔가 일을 벌이려 한다는 느낌이 온다면? 말도 안 되는 지시가 내려온 뒤 잘 안 풀리면 자기 탓이 될 거란 걱정부터 들 것이다.

따라서 일반적인 개발자들은 머신러닝을 무시하는 게 당장 속이 편한 일이다. 머신러닝은 자신과 상관없는 기술이라 여기거나, 도저히 넘볼 수 없는 벽으로 인식하고 도전을 포기하는 것이다. 부정적인 전망이 너무 확실시될 경우엔 머신러닝에 강한 거부감을 드러내기도 할 것이다. 여러 이유에서 조직내에 ‘머신러닝 무용론’을 설파하고, 그 활용 가능성을 원천 봉쇄할 수도 있다.

■머신러닝을 위한 중용의 미덕

머신러닝을 사용 중인 모든 기업에선 정작 머신러닝을 쓴다는 것 자체에 큰 의미를 부여하지 않는다. 머신러닝을 도입한 목적과 활용 방식에 무게를 둔다. 문제 해결을 위한 여러 선택지 가운데 하나였고, 완벽하지는 않지만 현시점에 최선의 선택이었다는 데 방점을 찍는다.

인터넷 검색 결과 배치와 클라우드상의 사용자 데이터 분류, 서비스 내 상품추천 기능에 머신러닝을 쓰는 네이버는 그 균형점을 잡고 있는 회사다.

네이버는 라인 스티커 추천, 지식쇼핑 상품 카테고리 분류, 네이버 클라우드의 사진 분류 등 서비스 사용자에게 조금이라도 편리한 부분을 만들어 주기 위해 머신러닝을 쓴다.

네이버 김정희 수석연구원은 "풀려는 문제가 뭔지 먼저 정의해야 하는데, 그런 것 없이 머신러닝을 도입하겠다고 하면 '소 왓'일 뿐"이라며 "목적과 수단이 뒤바뀌어선 안 된다"고 지적한다.

김 수석은 "구글이나 페이스북이나 이전부터 머신러닝을 해 왔던 회사"라며 "이들이 발표하는 논문 주제는 미래지향적이지만, 다루는 내용은 각자 서비스 품질 개선을 위해 만든 기술이고, 실제 그들의 고민은 기술을 어떻게 서비스에 녹여낼지 여부"라고 덧붙였다.

풀어야 할 문제와 이에 관련된 데이터를 갖고 있어야 머신러닝 도입과 활용에 의미가 생긴다. 네이버만큼은 아니더라도 데이터를 다루는 회사라면 머신러닝 도입을 고려해볼만하다. 오해를 넘어 시장이 원하는 제품과 서비스를 만드는 도구의 하나로 머신러닝을 활용하고 있거나, 활용하려는 국내 기업들의 행보에 중용의 미덕이 필요하다.

머신러닝은 뚜렷한 한계를 갖는다. 성과가 나오고 있지만, 어디까지나 특정 분야에 국한된다. 모든 곳에서 효과를 거둘 수 있는 수준은 아니다. 때문에 어떤 산업분야나 기업체가 머신러닝 도입과 활용의 유망주가 될 것이라고 지레짐작하는 건 위험한 일이다. 머신러닝이 당장 신통한 결과를 보여 줄 것이라는 환상뿐아니라, 진득하게 활용하기만 하면 어떻게든 결과가 나올 것이라는 믿음도 당장은 경계해야 한다는 얘기다.

영상인식과 머신러닝 관련 정보를 교환하는 페이스북그룹을 운영하는 개발자 이동윤 씨는 "아직 머신러닝으로 효과를 볼 수 있는 분야는 커뮤니케이션 의미분석, 상품 추천, 영상인식 신호감지, 반도체 수율관리 등 빅데이터 활용 영역 중 일부"라며 "신규 분야가 나오겠지만, 그걸 찾아낼 사람은 아직 소수"라고 선을 그었다.

머신러닝을 비즈니스에 활용하는 도구로 명확하게 인식하고 있는 것만으로도 충분하지 않다. 결국은 사업이 잘 풀려야 하는데, 이건 머신러닝에 대한 이해 수준이나 그걸 활용하는 역량과는 또 별개다.

스타트업 ‘루닛’의 이정인 최고기술책임자(CTO)는 “창업 초기 접근한 도메인이 패션 쪽인데, 기술적 성취는 있었지만 비즈니스로 어떻게 풀어갈 것인지 측면에서 어려움이 많다는 괴리가 있었다”며 “패션은 유망분야가 아니라 보고 의료 쪽으로 영역을 바꿨다”고 밝혔다.

루닛의 현재 비즈니스 영역은 의료영상 분석인데, 이미지 분석을 위한 머신러닝 알고리즘을 바탕으로 패션 산업계 비즈니스 모델을 탐구하다가 방향을 튼 케이스다.

네이버 김정희 수석은 “작년 말이나 올초까지 한 1년전 무렵만 해도 스타트업 쪽에서는 (머신러닝 중 가장 핫한 방법론인) ‘딥러닝’ 전문성을 바탕으로 투자받고 그런 분위기가 있었는데, 이젠 그렇게 비즈니스모델 없이 기술력만 갖고 투자유치를 하기가 힘들어지지 않았나 싶다”고 언급했다.

머신러닝은 목적이 아니다. 머신러닝은 툴이다.

3편에 계속...

------------------------------------------------------------

[글 싣는 순서]

①머신러닝, 이러다 미신러닝 될라

②머신러닝, 못 한다고 전해라

관련기사

③머신러닝은 툴이다

------------------------------------------------------------

김우용, 임민철, 임유경 기자yong2@zdnet.co.kr