[인공지능 칼럼] 2020년의 인공지능, 이런 인재를 키워야 한다(중)

컴퓨팅입력 :2020/04/01 12:04    수정: 2020/04/02 14:43

김진형 중앙대 석좌교수. 전 인공지능연구원장. KAIST 명예교수

데이터로부터 학습:딥러닝의 부상

인공신경망은 신경세포의 작동 기재에서 영감을 얻은 학습 및 의사결정 모델이다. 인공신경망은 입력을 처리하여 출력을 내는 함수로 볼 수 있다. 모든 데이터에 대하여 입력에 해당하는 출력이 나오도록 노드간에 연결된 링크의 연결강도를 조정하는 것을 학습이라고한다.

데이터 학습 능력으로 50년대 각광을 받았던 단층 신경망은 그 성능의 한계가 밝혀 짐에 따라 곧 시들해졌다. 다층 신경망의 훈련을 위하여 80년대 초 '오류역전파'라는 알고리즘이 알려졌으나 2010년에 이르기까지 성과는 미미했다.

여러 계층으로 구성된 큰 인공신경망은 복잡한 함수를 모사할 수 있다. 그러나 연결의 수가 수백만개가 되는 큰 인공신경망을 수만 개의 훈련용 데이터에서 모두 작동하도록 모든 연결강도를 조정하는 일은 쉬운 일이 아니다. 많은 계산이 필요하다. 2012년 물체인식에서 성과를 보인 힌튼(Hinton)교수팀의 AlexNet은 고층 신경망, 즉 딥러닝 기술의 기폭제였다. 딥러닝의 성공에는 학습 알고리즘의 발전도 일조를 했지만 강력해진 컴퓨팅 파워와 많은 데이터의 가용성이 큰 역할을 했다.

AlexNet은 5층의 합성곱(Convolution) 단계로 구성되었으나 2016년의 ResNet52는 152층을 사용했다.이제 딥러닝은 깊이의 경쟁,즉 컴퓨팅 파워의 경쟁이 되었다. 최근 문장 생성에 사용된 GPT2는 구조는 다르지만 15억개의 파라미터를 사용하는 복잡한 구조를 갖고 있다. 이후 딥러닝 기술은 음성이나 영상 인식에서 사람의 능력을 능가하는 성능을 보여 주었다. 심지어는 얼굴 인식율이 99% 이상이라는 주장을 가끔 접할 정도다. 이외에도 영상 및 음성의 스타일 변환, 그리고 언어 번역, 문장 생성 등에서 놀라운 성과를 보이고 있다. 지금도 딥러닝의 약진은 진행형이다.

딥러닝의 한계

딥러닝 사용이 10년이 되어가니 여러가지 약점이 발견된다.그 약점들은 데이터 기반 기계학습이 갖는 원초적인 것부터 시작하여 엔지니어링 노력의 부족까지 다양하다. 이러한 약점이 곧 해결될 것이라는 기대도 있고 쉽지 않을 것이라는 우려도 있다.

어떤 한계가 있는지 잠시 둘러보자. 딥러닝의 결론은 작은 변화에 잘 부서진다. 잘 인식하던 영상에 사람이 인지하지 못할 정도의 조그마한 변형이 가해지면 엉뚱한 결과를 낸다. 고양이와 강아지를 구분 못하는 것은 웃어 넘기면 된다. 하지만 자율자동차가 교통표지판을 잘못 인식한다면 심각하다. 테러리스트들에게 악용될 수도 있다. 이런 적대적(Adversarial) 사례들이 지적된 것이 수년 전이지만 이를 어떻게 회피할 것인가에는 아직 답이 없다.

딥러닝은 약간의 명도 변화를 가하면 잘 하던 인식에 실패한다. 또 잘 훈련된 프로그램도 게임의 조건을 조금만 변경해도 바보가 된다. '만약 ~이라면'과 같은 가정 상황을 처리하지 못한다. 배운 것을 새로운 상황에서도 사용하는 능력을 일반화라고 한다. 즉 학습에 사용되지 않은 입력에도 정답을 낼 수 있는 능력이다. 딥러닝은 일반화 능력이 약하다. 또한 이미 알고 있던 지식과 새로운 데이터와의 통합에도 취약하다.

신경망은 "왜?"라고 물으면 대답을 못한다. 의사결정 과정을 인간이 사용하는 언어로 설명을 못한다. 중요한 결정에서 판단 근거를 설명하지 못하는 것은 사용성을 크게 제약한다. 설명을 하려면 결국은 모델,즉 의사결정자가 보는 '세상'을 가지고 있어야 한다. 세상은 인과관계, 계층구조 등 다양한 지식들로 구성된다. 사람은 오랜 진화를 통해서 형성한 세상 모델을 매우 강력하게 사용하는데 반해 딥러닝이 배우는 것은 단순한 연관 관계뿐이다.

평범한 일상의 상황이 명시적으로 주어지지 않아도 물리적 특성, 등장 인물의 목적이나 의도 등을 이해하는 능력을 상식적 추론(Commonsense Reasoning)이라한다. 이런 능력은 사람은 갖고 있으나 지금의 인공지능에는 없는 부분이다.

이런 것들을 해결하려면 모델 기반의 기호적 방법론과 데이터 기반의 신경망적 방법론을 혼합해야 한다고 많은 학자들이 이미 오래전부터 주장했다. 올 초 AAAI학회에서 딥러닝의 대부라는 Hinton교수 등 3인이 등단해 '답러닝의 약점은 고쳐질 수 있다'고 주장했다. 그들의 주장이 맞기를 바란다.딥러닝의 발전이 이런 난제의 해결에 일조하기를 바란다.

우리나라에도 딥러닝 방법론의 약점을 해결하고 인공지능의 기본원리등을 '연구'하는 학자들이 있기를 바란다. 그래서 우리도 세계 시민으로서 인공지능이라는 학문의 발전에 동참하고,인류 발전에 공헌하기를 기대한다. 그러나 이런 기초연구에의 투자는 우리 국력에 어울리는 정도면 충분하다. 우리가 지금 시급히 필요로 하는 것은 인공지능을 활용할 수 있는 능력이다.

■딥러닝의 산업적 가치는 증명되었다

딥러닝 기술은 이미 많은 성공사례를 보여줌으로써 산업적 가치를 충분히 증명했다.딥러닝은 이제 특별한 기술이 아니다. 누구나 사용하는 기술이 되었다. 더 이상 미래의 비전이 아니라 현실의 기술이 된 것이다. 농기구에서 의료기기에 이르기까지 딥러닝이 우리 삶과 긴밀히 통합되어 있다는 것을 올초 미국에서 열린 ‘CES2020’전시회에서 확인할 수 있었다.

관련기사

이제 우리는 딥러닝을 적극적으로 활용해서 경제적 가치를 창출해야 한다. 더구나 딥러닝은 누구나 사용할 수 있는 공개 기술이다. 학술 자료는 물론이고 공개소프트웨어의 개방과 공유로 '기술의 민주화'가 이루어졌다. 훈련된 네트워크 공유도 빈번하다. 작은 스타트업 회사들도 최고의 인공지능 기술을 사용할 수 있다. 이제는 발견보다 실행이, 전문지식보다 데이터가 중요하다는 주장이 실감 나게 들린다.

인공지능으로 무엇을 할 수 있고,무엇을 할 수 없는 지를 정확하게 이해하는 것이 중요하다. 연구자들은 종종 무리한 목표를 설정하고, 언론과 IT기업들은 성과를 과장한다. 무리한 목표와 무모한 도전은 성공보다 실패를 부른다. 그렇다고 시도조차 안하는 것은 기회를 상실하는 것이다. 기업들은 인공지능의 능력과 한계를 이해하고, 적용할 수 있는 능력을 갖춰야한다. 이를 위해 어떤 인재가 필요할까?

김진형 중앙대 석좌교수 겸 KAIST 명예교수