"oo은행, '엑사원 3.5'가 딱이네"…금융권 노린 LG CNS, 최적 AI 모델 골라준다

금융 AI 서비스에 적합한 LLM 평가하는 핵심 지표 개발…수십개 개방형 LLM 성능 평가

컴퓨팅입력 :2025/02/24 10:00    수정: 2025/02/24 11:41

LG CNS가 금융 맞춤형 인공지능(AI) 평가 도구를 앞세워 생성형 AI를 도입하고자 하는 금융 기업 공략에 나선다.

LG CNS는 미리 구축한 데이터셋으로 시중에 공개된 수십 개의 개방형 거대언어모델(LLM)을 평가해 뱅킹, 보험, 증권 등 각 금융 서비스에 가장 적합한 AI 모델을 찾아주는 주는 서비스를 개발했다고 24일 밝혔다. 

개방형 LLM은 공개된 소스코드나 알고리즘으로 누구나 자유롭게 수정하고 활용할 수 있는 거대언어모델(LLM)이다. 대표적으로 LG AI연구원의 엑사원(EXAONE) 3.5, 메타(Meta)의 라마(Llama), 알리바바(Alibaba)의 큐원(Qwen) 2.5 등이 있다.

금융 기업은 데이터 유출 등 보안의 이유로 AI 도입 시 개방형 LLM을 파인튜닝해 자체 모델을 구축한다. 파인튜닝은 AI 모델에 별도의 데이터를 학습시켜 특정한 목적에 맞게 만드는 과정을 의미한다. 오픈AI의 챗GPT나 구글의 제미나이(Gemini)같은 폐쇄형 LLM은 내부 소스코드가 공개되지 않아 기업이 자체 AI 모델로 구축해 활용할 수 없으며 돈을 내고 서비스를 이용하는 형태로만 사용 가능하다.

(사진=LG CNS)

LG CNS의 금융 특화 평가 도구는 29가지 평가지표와 약 1천200개의 데이터셋으로 구성돼 있다. 주요 평가 항목은 ▲금융 지식을 기반으로 추론하는 능력 ▲수학적 추론 능력 ▲복잡한 질문 이해력 ▲문서요약 능력 ▲금융 용어 이해도 ▲AI 에이전트(Agentic Tool) 사용 능력 등을 종합적으로 테스트한다. LG CNS는 특히 AI가 답변하기 어려워하는 금융 관련 추론 문제들을 29개 평가지표에 적용해 더 정확한 성능 검증이 가능하도록 했다.

LG CNS는 금융 전문가들과의 협업을 통해 데이터셋의 평가 데이터에 실제 금융 현장에서 사용하는 서비스 정보나 전문 지식 등이 정확히 반영됐는지 점검하며 완성도를 높였다. 이를 통해 AI가 금융 산업 내 규제 요건이나 복잡한 서비스 구조 안에서도 정확한 답변을 하는지 판단할 수 있게 했다.

LG CNS는 이 평가 도구를 통해 금융기업들이 AI를 도입할 때 최적의 LLM 선정부터 커스터마이징, 안정적인 운영까지 금융권에 특화된 생성형 AI 도입 전 단계에서 차별화된 고객가치를 제공해 나갈 계획이다.

관련기사

LG CNS는 다수의 금융 기업을 대상으로 생성형 AI를 활용한 비즈니스 혁신을 지속하며 금융 AX를 선도하고 있다. 최근 NH농협은행과 생성형 AI 플랫폼 구축 프로젝트에 착수했고, 신한카드와 생성형 AI 기반의 상담사 응대 시스템을 구축 중이다. 작년에는 신한은행과 함께 거대언어모델(LLM) 기반 미래형 영업점인 'AI 브랜치'를 개발했고, KB금융그룹에 AI, 클라우드 등 디지털 기술을 접목시킨 미래형고객센터(FCC, Future Contact Center)를 구축해 운영 중이다.

현신균 LG CNS 사장은 "금융 서비스에 생성형 AI를 도입하고자 하는 기업의 가장 큰 고민은 어떤 AI 모델이 서비스에 가장 적합할 지 파악하는 것"이라며 "자사금융 특화 AI 평가 도구는 금융 기업들의 고민을 빠르게 해결할 수 있는 최적의 솔루션이 될 것"이라고 말했다.