"저희는 2000년대 초반부터 자연어 처리를 전문으로 해왔습니다. 국내에서 가장 처음으로 GPT 기술을 사용한 기업이기도 합니다. 30년간 모아온 언어 자원들과 기술을 발전시켜 학습시켰으며, 온프레미스로 구축해 고객 내부 정보 보안 이슈도 해결했습니다."
27일 서울 강남 코엑스A홀에서 열린 '디지털 미래혁신대전 2023' 솔트룩스 부스에서 만난 유재민 책임은 대규모언어모델(LLM) ‘루시아(LUXIA)'를 이같이 소개했다.
솔트룩스가 올해 초 공개한 루시아는 AI 데이터 구축 관련 정부 사업뿐 아니라 특허청, 행정안전부 등 다양한 분야의 사업을 수행하며 축적해 온 한글 데이터 약 1테라바이트(TB) 이상을 학습했다.
유재민 책임은 "매개변수(파라미터) 규모가 70억·130억·200억·500억개로 다양하게 구성돼 기업에서 사용 목적과 예산에 맞춰 도입할 수 있다"며 "1천억개 규모로 확장될 예정이다"고 말했다.
그는 "루시아가 생성형AI의 고질적 문제로 지적받는 할루시네이션(환각) 최소화를 위해 RAG와 지시그래프를 연계해 근거성 있는 데이터로 답변하도록 하고 있다"며 "고객 도메인 특화 모델 온프레스 구축과 권한 관리를 통해 정보 외부 유출 고민을 해소했다"고 설명했다.
또 루시아는 실시간 데이터 연계로 최신 정보를 참조하며 복잡한 코딩 없이 손쉽게 특화 언어모델을 구축할 수 있도록 100% 노코드 언어모델 개발 환경을 구축한 것이 특징이다.
챗GPT 공개 이후 생성형 AI에 대한 젊은층의 관심이 높아지자, 솔트룩스 부스는 취업준비생들의 눈길을 끌기도 했다.
관련기사
- 솔트룩스, '인공지능 컨퍼런스 2023' 9월 개최2023.08.09
- 한국소프트웨어산업협회, 2023디미혁 특별관 마련2023.09.25
- '한국어 문서' 잘 쓰는 AI, 업무 도우미로 발돋움2023.09.27
- "엑셀도, 업무 파악도 한눈에 쉽게 가능"2023.09.27
유재민 책임은 "취업준비생들이 지나가다가 채용과 관련해 묻는 경우가 많았다"며 "기업 소개와 입사위해 준비해야할 내용들에 대해 안내하기도 했다"고 말했다.
솔트룩스는 이번 전시에서 키오스크에서 작동하는 멀티모달 가상인간 '한지아'를 소개하기도 했다. 방문객을 인식하고 사람처럼 응대할 수 있는 기능을 갖췄다. 루시아 언어모델을 탑재해 자연과학, 인문사회, 정치 등 다양한 분야 주제로 대화하는 것도 가능하다.