카카오뱅크, CSS로 '일' 낸 사연?

국제학술지에 '2단계 CSS 모형' 논문 게재…공동 연구자 신진호·경성현 팀장 인터뷰

금융입력 :2022/12/05 10:25    수정: 2022/12/05 15:21

카카오뱅크가 더 많은 중·저신용자 고객을 포용하기 위한 신용평가모형(CSS) 독자적 개발과 고도화에 집중하고 있다. 최근 카카오뱅크 소속 금융기술연구소에서 연구한 새로운 CSS 모형은 빅데이터 이론 및 방법론 부문 국제 학술지 '저널 오브 빅데이터(Journal of Big Data)'에 실렸으며, 많은 금융사의 문의가 이어지고 있는 상황이다.

카카오뱅크 이용자들의 발자취 격인 로그데이터를 통해 모형을 실증해본 결과 기존 금융사에서 쓰고 있는 CSS보다 통계적으로 유의미한 성능 개선이 이어졌다는 것이 회사 측 설명이다. 카카오뱅크가 새로 개발한 CSS가 무엇인지, 어떤 점을 주목해야 하는 지를 연구를 진행하고 논문을 작성한 카카오뱅크 신진호 금융기술연구소 연구개발팀장과 카카오뱅크 경성현 빅데이터분석팀 내 데이터프로덕트팀장을 인터뷰했다.

"2단계로 정보 영역 나눠 CSS 만들어…유의미한 성능 개선"

카카오뱅크가 연구한 CSS 모형은 '2단계 CSS 모형'이다. 2단계로 정보 영역을 나눠 접근해 CSS를 만들었다는 점이 기존 금융사가 쓰고 있는 CSS와 가장 다른 점이다. 카카오뱅크 경성현 팀장은 "2단계를 예를 들면 개인사업자 대출을 진행 시 개인사업자들의 매출을 그 가게의 카드 매출, 현금 매출 등으로 영역을 나누고 그 비중을 조정해 개인사업자의 신용평가를 하는 격"이라며 "이미 기업 대출의 경우 기업의 현금 흐름과 매출 등 영역을 나눠서 신용평가를 한다"고 설명했다.

(사진 왼쪽부터)카카오뱅크 신진호 금융기술연구소 연구개발팀장과 카카오뱅크 경성현 빅데이터분석팀 내 데이터프로덕트팀장.

2단계로 나눠서 할 경우 쓸 수 있는 변수가 더 늘어난다는 점이 큰 차별점이다. 기존 금융사에서는 신용평가 시 한정적인 변수를 통해 부도율(연체율)을 예측하도록 세팅돼 있다. 그렇지만 이 신용평가에는 평가받는 대출자(차주)와 연관된 수십 혹은 수백개의 변수가 녹아들어 있진 않다. 신진호 "CSS에 반영할 수 있는 변수가 훨씬 많을 수 있는데 실제 최종적으로 모형 안에 살아남게 되는 변수가 10개 내외"라며 "로지스틱 회귀 분석 상 변수 간 '선형적으로 독립돼야 한다'는 근거 때문"이라고 말했다.

결국 2단계 CSS는 1단계로 구성된 CSS에 비해 더 많이 차주를 평가할 수 있는 변수를 활용할 수 있다. 경성현 팀장은 "1단계 모형의 변수가 10개라고 가정하고 10개 정보에 관한 서브 모형을 각각 개발했으며, 2단계선 1단계의 영역별 신용점수를 하나의 변수로 취급하도록 구성됐다"며 "CSS서 정보량이 성능을 좋게 하기 때문에 2단계 CSS선 1단계로 구성된 기존 금융사 CSS보다 유의미한 성능 개선이 나타났다"고 설명했다.

로그데이터 분석....설명가능하다는 점도 강점

카카오뱅크는 연구를 로그 데이터를 기반으로 실증 작업도 진행했다. 카카오뱅크서 계좌나 카드 이력을 몇 번 했는지, 얼마나 자주 했는지부터 카카오뱅크의 푸시 알람에 얼마나 반응했는지와 같은 데이터를 토대로 2단계 CSS를 적용해 이들의 연체율을 기존 모형보다 얼마나 더 잘 파악하는지를 수행한 것이다.

신진호 팀장은 "지금 시중은행이나 금융권 전반적으로 사용하고 있는 CSS 모형 기법인 로지스틱 회귀 분석이라는 걸로 1단계 신용평가 모형을 만들었을 때는 그 모형의 성능이 이제 최근에 부각되는 머신러닝 모형의 성능보다는 더 낮았다"며 "2단계 CSS는 이 셋 중 가장 성능이 높았다"고 부연했다.

특히 이 모형은 기존 모형을 보완해서 쓸 수 있다는 점도 주목할 만 하다. 신 팀장은 "기존 은행서 더 많은 변수를 씀으로써 모형의 성능을 개선하고 고객 민원 시 납득할 만큼 충분히 설명이 가능하다는 점도 이 모형의 차별점"이라고 언급했다.

흔히 고객들은 첫 대출 조회 시와 대출 금리 변동이 있다는 점을 의아해 한다. 이에 대해서 2단계 모형이 유효하다는 부연이다. 신 팀장은 "정확하고 구체적으로 대출 금리가 왜 변했는지를 설명해야 하는데, 무조건적으로 성능을 높이기 위한 CSS에서는 어떤 점이 어떻게 영향을 미치는지 말하기 어렵다"며 "2단계 모형선 어떤 변수가 왜 신용점수에 영향을 미쳤는지를 파악해서 전달할 수 있다"고 덧붙였다.

신 팀장은 "카카오뱅크도 새로운 데이터를 입수해 적용해야겠다는 실무진끼리의 논의가 있었으며 현재 쓰고 있는 '카카오뱅크 2.0 CSS'와 접목해 상용화할 수 있도록 준비하고 있는 중"이라고 귀띔했다.

CSS는 고객을 위한, 가장 도움되는 기술 

은행뿐만 아니고 대출을 취급하는 모든 금융사들은 CSS에 집중하고 있다. CSS는 고객을 정확하게 파악할 수 있는 바로미터이자 또 금융사들의 건전성과 직결된 중요한 기술이기 때문이다.

(사진 오른쪽부터)카카오뱅크 신진호 금융기술연구소 연구개발팀장과 카카오뱅크 경성현 빅데이터분석팀 내 데이터프로덕트팀장.

신진호 팀장은 "변수가 한 두개만 추가되더라도 성능이 80%에서 83%로 올라가는데 이게 미미할지 모르겠지만 의미가 크다"며 "기존 CSS에서 좋은 사람이라고 평가된 이들은 계속 금융사로부터 대출을 받을 수 있고 그 외의 사람들은 정보가 없는 CSS가 계속된다면 피해가 의외로 커질 수 있기 때문이며, 시중은행 리스크 담당자들도 약간의 데이터 소스를 확장해가지고 성능이 올라가는 것도 큰 의미로 생각하고 있다"고 귀띔했다.

관련기사

카카오뱅크는 2단계 CSS를 기반으로 금융 이력자(씬파일러)를 잘 평가하는 디딤돌이 되기를 기원하고 있다. 경성현 팀장은 "CSS는 필요한 사람에게 필요한 만큼 대출을 해줄 수 있는 기술이라고 생각한다"며 "대출이 필요한 사람은 많은데 기존 시중은행의 평가 방법서는 제공하지 못한 영역이 있는데, 카카오뱅크가 더 잘 할 수 있는 기술이라고 본다"고 말했다.

신 팀장은 "신용평가는 카카오뱅크가 고객에게 혜택을 주고 도움이 될 수 있는 가장 중요한 수단이자 기술"이라며 "자금을 쉽게 못 빌리는 고객에게 카카오뱅크가 신용평가를 좀 더 잘해서 자금을 공급할 수 있다면 가장 실질적으로 도움이 될 것"이라고 강조했다.