"이 고객에게 이 금융 상품을 추천했을 때, 고객이 이 추천을 마음에 들어할까? 그리고 고객이 추천 결과를 보고 금융 상품을 신청하게 되면 승인이 날 수 있을까?"라고 물었더니 화면에는 한 줄이 뜬다.
"네, 해당 금융상품은 고객도 좋아하고 승인도 가능한 상품입니다." 금융 마케팅의 현실에서 진짜 중요한 질문은 그 다음이다. "그럴 거라고 얼마나 확신해?"
생성형 AI(GenAI)가 일상으로 들어오면서 금융회사들도 상담, 상품 안내, 서류 요약, 보고서 작성 등 다양한 영역에 AI를 도입하고 있다.
그러나 고객에게 최적의 상품을 제안해야 하는 '상품 매칭·추천' 영역에서는 한 가지 벽에 부딪힌다. 사람처럼 설득력 있게 설명하는 AI와 실제로 고객에게 딱 맞는 상품을 '확신을 갖고 골라주는' AI는 전혀 다른 문제이기 때문이다.
어피닛에서 AI 금융을 고민하며 붙잡고 있는 키워드는 '신뢰의 정량화'다. AI가 어떤 상품을 추천했느냐만이 아니라, 그 추천에 대해 얼마나 자신 있는지 그 신뢰도를 숫자로 측정해 금융 의사결정에 직접 연결하는 것이다.
예를 들어 생성형 AI가 수만 건의 거래 내역, 소비 패턴, 투자 성향을 읽고 "이 고객에게 A 상품은 추천(Y)", "이 고객에게는 비추천(N)"이라고 판단했다고 가정하자.
텍스트로만 보면 둘 다 똑같이 '추천'이지만 실제로는 한 고객에 대해서는 90% 확신을, 다른 고객에 대해서는 55% 정도만 확신을 가지고 있을 수 있다.
금융사는 이 미묘한 차이를 알아야 채널·혜택·조건을 세밀하게 조정할 수 있다.
초개인화된 금융 서비스의 난제, "AI의 마음속 확률"
문제는 기존 생성형 AI가 이 확신도를 사람 눈에 보이는 형태로 제공하지 않는다는 점이다. 답변의 내용은 알 수 있지만 그 뒤에 숨은 "AI의 마음속 확률"은 그대로 두면 블랙박스에 가깝다.
단순히 생성형 AI에게 확신도를 숫자나 확률로 표현해달라고 부탁하면, 근거가 부족하거나 환각이 섞인 믿을 수 없는 숫자를 내놓기도 한다. 이 불확실성을 해결하는 것이 초개인화된 금융 서비스를 위한 큰 난제이다.
어피닛 AI/데이터팀은 이 부분을 해결하기 위해 생성형 AI가 내부적으로 계산하고 있는 '응답 토큰의 로그확률(log probability)'을 꺼내서 상품 적합도 또는 구매 전환 확률로 변환하는 방법을 연구해 왔다.
쉽게 말해 "AI가 내린 판단에 스스로 얼마나 자신 있는지"를 수치로 읽어내고, 이를 과거의 실제 데이터와 연결해 금융에서 통용되는 지표로 바꾸는 작업이다.
사용하는 접근법은 대략 이렇다. 먼저 소득, 신용등급, 금융 명세서, 상담 기록 등 고객에 대한 다양한 데이터를 모으고, 그중 꼭 필요한 정보만 뽑아 프롬프트에 담는다.
그런 다음 모델의 출력은 "Y(추천) / N(비추천) / U(보류)" 세 토큰으로만 제한하고, 추론 시 각 토큰의 로그확률을 함께 받아온다. 이 숫자가 곧 AI가 각 선택지에 두는 '마음속 확률'이다.
이 값을 ML 방법론을 이용해 정제해 과거 데이터와 비교해 보정(calibration) 함수를 학습하면 특정 구간의 값이 "실제 가입 확률이 몇 퍼센트인 고객군"인지, 혹은 "상품 만족도가 어느 수준일지" 해석할 수 있다.
이 과정을 거치면, 생성형 AI의 텍스트 답변은 더 이상 참고용 조언에 머물지 않는다. "이 고객은 추천, 예상 가입 확률 85% 이상", "이 고객은 승인하되, 확신도는 50% 수준"과 같이 추천 엔진이 바로 활용할 수 있는 숫자 지표로 변환된다. AI의 판단이 고객 접근 방식, 채널, 정책과 한층 촘촘하게 연결되는 것이다.
신뢰를 정량화하면 현업에서 체감하는 이점도 분명하다. 새로운 금융 상품이 출시되거나 트렌드가 바뀌어도 건대 언어 모델 전체를 다시 학습할 필요 없이 보정 함수만 업데이트하면 되니 시간과 비용을 크게 줄일 수 있다. 국가·언어·상품이 달라져도 보정 레이어만 각 시장의 데이터로 따로 학습하면 되기 때문에 확장성 면에서도 유리하다.
일반 소비자의 눈에는 이 모든 과정이 다소 복잡하게 느껴질 수 있다. 그러나 본질은 간단하다.
"AI가 내린 결정을 맹목적으로 믿지 말고 그 결정에 대한 확신도를 숫자로 들여다보자", 그리고 "그 숫자를 금융의 언어로 번역해 책임 있는 의사결정에 쓰자"는 것이다. 이것이 바로 AI 금융에서 말하는 '신뢰의 정량화'다.
앞으로 금융 산업에서 AI 활용의 성패는 모델이 얼마나 말을 잘하냐보다, 얼마나 투명하고 통제 가능하냐에 달려 있다고 생각한다.
규제 당국은 설명 가능성과 책임 소재를 요구하고, 고객은 나에게 진짜 맞는 상품을 원한다. 금융사는 불완전 판매를 막고 효율을 높여야 한다. 숫자로 표현된 신뢰도 지표는 이 둘 사이의 간극을 줄여 줄 수 있는 중요한 도구다.
어피닛은 생성형 AI를 단순한 혁신 키워드가 아니라, 실제 현장에서 고객 경험을 혁신하고 더 많은 사람에게 금융 기회를 넓히는 기술로 만들고자 한다. '신뢰의 정량화'는 그 과정에서 우리가 가장 중요하게 붙잡고 있는 원칙이다.
AI가 인간을 대신해 결정을 내리는 시대일수록, 그 결정을 뒷받침하는 수치와 근거는 더 정교해져야 한다.
AI 금융의 핵심 키워드는 화려한 기술 용어가 아니라, 결국 "얼마나 믿을 수 있는가"다. 그리고 그 질문에 답하는 가장 현실적인 방법이 바로 신뢰를 정량화하는 일이다.
*본 칼럼 내용은 본지 편집방향과 다를 수 있습니다.










