바이브, 보안 문제 등 해결 생성AI 두 종류 성보여

'바이브Gem'과 '바이브 서치GPT'...한국어로 학습 한 것과 파인튜닝도 장점

컴퓨팅입력 :2023/06/05 15:10

바이브컴퍼니(대표 김성언, 이하 바이브)는 자체 개발한 생성형 AI 언어모델 '바이브GeM(VAIV Generative Model for language, VAIVGeM)'을 공개한다고 5일 밝혔다.

앞서 바이브는 지난 2일 열린 자사 인공지능·빅데이터 연구소 주관 기술 워크숍 '바이브 테크데이(VAIV Tech-day)'에서 '바이브GeM'과 함께 '뉴럴서치(Neural Search, 신경망 검색)' 기술과 언어생성 기술을 결합한 '바이브 서치GPT(VAIV SearchGPT)'를 선보였다. 

바이브는 이들 제품이 보안과 '환각(hallucination)' 문제를 해결한 생성형 AI라고 밝혔다. 업무 효율을 높여주는 챗GPT는 전 산업군에 AI 수요를 불러왔지만 공공기관이나 대부분의 기업은 데이터 유출 등 보안 문제로 당장 도입을 꺼리는 분위기다. 이에 '바이브 서치GPT'는 머신러닝 과정에서 데이터가 외부에 공개되는 것을 원하지 않는 기업이나 기관을 위해 온프레미스(On-Premise, 사내구축형)로 제공, 보안 이슈에서 자유롭다.

또 생성 결과의 정확성과 신뢰성도 높였다. '바이브 서치GPT'는 AI 언어모델이 잘못된 정보나 허위 정보를 생산하는 할루시네이션 문제를 개선, 답변 근거가 되는 원문 데이터 출처를 함께 제시, 답변의 신뢰성을 높였다.

이외에 '바이브GeM'은 매개변수를 줄이고 미세조정으로 정확도를 높인 맞춤형 대규모 언어모델(LLM)로, 기존 LLM 대비 머신러닝에 소요되는 시간과 비용을 줄여준다. 또 코어 기술인 '바이브GeM'은 한국어 고유 특성을 잘 반영해 AI 학습을 진행한 한국어 특화 언어모델로 이 점도 차별성이다.

한편 바이브는 20년 이상 비정형 데이터를 수집하고 분석하는 꾸준한 연구 개발을 통해 다양한 빅데이터 분석 모델 개발 사업을 진행, 2020년과 2022년 과학기술정보통신부가 주관한 인공지능 학습용 데이터 구축 지원 사업을 성공적으로 마무리했다. 또, 지난해 한국어 기계독해 성능 테스트인 코쿼드1.0(KorQuAD1.0)에서 국내 유수의 기업들을 제치고 1위를 차지했다.

바이브는 뉴럴서치 서비스인 '바이브 서치(VAIV Search)'도 곧 선보일 계획이다. '바이브 서치'는 사용자가 궁금한 질문을 문장 형태로 입력하면 정답이 있는 문서를 찾아줄 뿐만 아니라 바이브 서치GPT를 탑재해 답변을 단 몇 줄로 요약까지 해주는 검색 서비스다.

기존 키워드 기반의 검색 서비스와 달리, 사용자가 여러 문서를 찾지 않아도 한눈에 원하는 정답을 찾아준다는 특징이 있다. 이외에도 '바이브GeM'을 기반으로 시장 수요에 맞는 ▲AI가 데이터의 수집, 분석부터 리포트까지 작성해주는 ‘바이브 리포트 코파일럿(VAIV ReportCopilot)’ ▲AI 대화 솔루션 ‘바이브 챗봇(VAIV Chatbot)’ ▲사용자가 원하는 뉴스를 선별해 요약해주는 ‘바이브 뉴스다이제스트(VAIV NewsDigest)’ 등 다양한 솔루션과도 결합, 제공할 계획이다.

바이브 인공지능·빅데이터 연구소 윤준태 부사장(CTO)은 “바이브의 생성형 AI 언어모델을 활용하면 다양한 산업 도메인에서 적은 비용으로 각 기업, 기관들이 특화된 언어모델을 자체 구축할 수 있다는 장점이 있다"면서 “바이브GeM을 지속적으로 고도화해 법률, 금융 정보 같은 전문 분야 특화 모델도 선보일 계획"이라고 밝혔다.