"금융에 특화한 인공지능(AI)은 우리가 잘한다고 생각하고 있습니다."
윤진수 KB국민은행 테크그룹 부행장 겸 CITO는 8일 열린 '11월 AIIA(AI Is Anywhere) 정기 초찬포럼'에서 이 같이 밝혔다. 행사는 지능정보산업협회와 지능정보기술포럼이 주최하고 지디넷코리아가 후원해 서울 서초구 JW메리어트호텔에서 열렸다.
이날 윤 부행장은 '금융권 AI도입 전략과 사례를 주제로 발표했다. KB국민은행에 있어 AI는 소통이라고 정의한 그는 "고객과의 소통을 위한 보고, 듣고, 말하고, 이해하는 기술에 집중하고 있다"고 밝혔다. 대부분의 소통은 음성과 문서로 이뤄지기 때문에 텍스트(Text) 분석이 핵심이라고 강조한 그는 "금융 도메인에 특화한 기술 확보에 주력하고 있다"고 말했다.
KB국민은행의 AI 전략 3대 방향도 밝혔다. 첫째, 지속가능성이다. 은행 업무에 실질적인 도움을 주는 AI기술을 지속가능한 형태로 사업에 적용한다. 둘째, 핵심기술 확보다. AI 핵심기술 내재화와 오픈 이노베이션을 통한 업계의 선도적 지위 유지에 매진하고 있다. 셋째, 외부 우수 인재 확보와 내부 육성을 통한 조직 전체의 AI역량 강화다.
윤 부행장은 금융도메인에서는 데이터가 정형 뿐 아니라 다양한 비정형 데이터(음성, 영상, 이미지 등)가 발생한다면서 "데이터 유형별로 수집, 분석, 활용에 대한 제약사항을 고려한 접근이 필요하다"고 제안했다.
KB국민은행 내부적으로 정형 데이터는 연령과 성별 등 고객 기본정보와 자산 및 부채 규모, 채널(대면, 비대면)별 거래 건수 등이 해당한다. 또 비정형 데이터는 고객상담정보(텍스트), 콜센터 고객상담 녹취, 비대면 행동 로그 등이다. 외부적으로 정형 데이터는 타 금융기관간 거래정보, 평가기관의 신용정보, 상권 및 지리 통계 정보 등이 있고, 비정형 데이터는 금리와 환율, 주가 등 경제 동향관련 기사, 인터넷 상의 고객 불만 정보, 뉴스와 블로그 정보 등이 있다.
내부적으로 비정형 데이터 수집이 저조하다고 밝힌 그는 "데이터 정형화에 많은 시간과 비용이 발생한다"고 들려줬다. 이어 비정형 데이터를 확보하고 분석하기 위해 노력하고 있는데 데이터 파악 과정에서 다양한 이슈가 발생한다면서 그 예로 ▲데이터 관리자 불분명 ▲외부 부서에 의존한 데이터 파악 ▲제한적인 데이터 접근 및 제공 요청 등을 들었다. 또 데이터 분석가가 데이터를 확인하고 분석하기 위해서는 수많은 절차를 거쳐야 하는 어려움이 있다면서 "담당자간 협의를 거쳐 실제로 데이터를 확보하기 까지에는 복잡하고 긴 시간이 소요된다"고 설명했다.
텍스트 형태 비정형 데이터 활용 사례로는 KB국민은행의 'STA(KB-STA)'를 예로 들었다. STA(State of the art Text Analytics)는 KB국민은행 금융AI센터가 개발했거나 개발하는 AI기반 한국어 텍스트 처리 기술(NLP)의 총칭이다. 회사는 세 가지(KB-ELECTRA, KB-BERT, KB-ALBERT) 딥러닝 기반 한국어 사전학습 언어모델 보유하고 있다. 윤 부행장은 "NLP 핵심 기술 보유시 다양한 애플리케이션에 적용할 수 있는 장점이 있다"고 말했다.
'KB-STA' 기술셋에 적용한 기술은 ▲언어모델(딥러닝 기반 한국어 사전학습) ▲형태소 분석(한국어 형태소 분리 및 복원, 품사 부착) ▲개체명 인식(문서에 언급된 이름 및 카테고리 추출) ▲키워드 추출(중요 단어 또는 문장 추출) ▲주제와 의도 분류(주제, 의도, 감성 등 자동 분류) ▲이벤트 추출(관심 이벤트 표현 추출) ▲유사문서 검색(의미 기반 벡터 인코딩 및 검색) ▲기계독해(질문 및 본문으로부터 적절한 답변 추출) 등이다.
윤 부행장은 "업무 상황에 맞는 신규 NLP(Natural Language Processing)와 NLU(Natural Language Understanding) 모델 개발이 가능하다"면서 "올 9월 KB-STA 버전 3.0을 선보였다. 아직까지 우리가 금융쪽에서 잘하고 있다고 생각한다"고 진단했다. 특히 그는 멋진 엔진을 만드는 것보다 "적용 사례를 만들어 가는게 더 중요하다"고 덧붙였다.
KB국민은행은 광학문자인식(OCR)에도 비정형 데이터를 활용하고 있다. OCR은 이미지 내의 문자를 읽어내는 기술을 말한다. KB국민은행의 'AI OCR'은 먼저 단어 위치를 AI검출기가 찾고, 이어 이미지에서 단어를 AI인식기가 읽은 후, 해당 단어가 갖는 의미를 AI문자분석기를 통해 찾아내고, 이 것으로 필요한 업무를 처리하게 해준다.
이 밖에 윤 부행장은 KB-STA 적용 사례로 'One-KB AI검색'과 금리 및 환율 컨센서스(내부고객), 콜봇과 챗봇(외부고객), AI금융비서 등을 들었다. 특히 AI금융비서에 대해 윤 부행장은 "중장기적으로 집중하는 영역이다. 인공지능 엔진을 확보하기 위해 노력중"이라면서 "생각보다 장비와 비용이 많이 들어간다"고 설명했다.
윤 부행장에 이어 발표를 한 이동석 티맥스알지(TmaxRG, 구 티맥스에듀) 대표는 AI를 에듀테크 분야에 적용한 사례를 밝혔다. 티맥스는 애플리케이션 분야 시장으로 에듀테크와 핀테크, 커머스, ERP와 CRM 분야를 조준하고 있다. 음성언어처리기술인 STT와 TTS가 네이버 못지 않은 기술 수준을 갖고 있다고 강조한 이 대표는 "콜센터 고객 음성에서 추출한 텍스트 단어와 문맥을 기반으로 감성 분석을 하고 있다"고 밝혔다. 이 대표는 AI로 한글 에세이를 평가하는 모델도 개발했다면서 "글에 등장하는 여러 평가 요소를 종합적으로 반영해 학습하는 방식으로 문법 오류 수정도 가능하다"고 설명했다.
인텔의 인공지능 전략과 차세대 제품 및 솔루션을 발표한 나승주 인텔코리아 상무는 AI생산성 극대화를 위한 인텔의 소프트웨어 최적화 노력을 소개하며 "하드웨어 엔지니어보다 소프트웨어 엔지니어가 더 많다"고 밝혔다
. 또 인공지능하면 데이터 학습(트레이닝)과 추론 두 가지를 생각하는데 "AI 사이클은 종단간 전체 파이프라인에서 극히 일부"라고 주장했다. 이어 AI에 대한 인식을 이제 바꿀때라면서 "엔비디아가 대다수라고 인식하고 있지만 현실은 반대다. 데이터센터 추론의 70%는 인텔이 개발한 '제온' 칩 기반에서 이뤄지고 있다"면서 "인텔이 내년 1월 하드웨어와 소프트웨어를 보다 가속화한 4세대 제품을 발표할 계획"이라고 말했다.