LG AI연구원 "3대 전문가 AI로 시장 공략"

[2023 디미혁] 초거대 AI 모델 '엑사원 2.0' 소개

컴퓨팅입력 :2023/09/26 11:13

LG AI연구원이 '3대 전문가 인공지능(AI)'으로 AI 비즈니스 활용 가능성을 높였다.

LG AI연구원은 25일부터 27일까지 서울 코엑스 A홀에서 열리는 '대한민국 디지털미래혁신대전 2023' 부스에서 최근 업데이트한 초거대 AI 멀티모달 모델 '엑사원 2.0'을 전시하고 이같이 강조했다. 

이 기업은 2021년 멀티모달 모델 엑사원을 처음 출시했다. 네이버나 KT 등 다른 국내 AI 모델과는 다른 점도 있다. 타사 AI 모델은 텍스트 또는 이미지만 이해, 생성할 수 있다. 반면 엑사원은 텍스트와 이미지 모두 이해, 생성할 수 있다. 엑사원에 텍스트를 입력하면 이에 맞는 이미지를 생성하고, 이미지를 넣으면 이를 텍스트로 설명하는 식이다.

디미혁에 설치된 LG AI연구원 부스.

이 엑사원은 올해 7월 기존 모델보다 더 고도화된 '엑사원 2.0'으로 진화했다. 이번 행사 부스에도 엑사원 2.0가 전시됐다. 엑사원 2.0은 ▲엑사원 유니버스 ▲엑사원 디스커버리 ▲엑사원 아틀리에 버전으로 이뤄졌다. 실제 각 분야에서 활용이 쉽도록 목적에 맞춰 나눈 셈이다. 

"엑사원 유니버스로 '진짜 전문가'와 대화"

엑사원 유니버스는 전문가용 대화형 AI 플랫폼이다. 일반적인 질의응답을 넘어서 전문 지식 기반으로 답할 수 있다. 

엑사원 유니버스 화면. 최신 데이터에 기반해 전문적 답변을 할 수 있다. 사이드 화면에는 답변에 대한 출처도 적혀 있다.

부스를 지키던 LG AI연구원 관계자는 "엑사원 유니버스는 챗GPT 등 다른 챗봇 서비스와 다르다"며 "답변을 생성하는 방식에서 차이점이 있다"고 설명했다. 타사 AI 모델은 사전 학습한 데이터에 기반해 답변을 만들지만, 엑사원 유니버스는 산업별 최신 데이터에 기반해 답변을 만든다.

예를 들어, 연구소 고객이 최신 논문을 모델 데이터베이스(DB) 넣으면, 유니버스는 이를 기반으로 답한다. 기업 고객이 업무 매뉴얼 정보를 모델 DB에 추가하는 경우도 마찬가지다. 사용자가 업무에 대해 질문하면, 유니버스는 해당 DB를 통해 추론 및 답변 생성을 진행한다.

유니버스는 답에 대한 근거도 제시한다. 모델에 넣은 DB에 기반해 제공한다. 화면 좌측과 우측에는 질문과 관련된 문헌도 내놓는다. LG AI연구원은 "사용자는 유니버스를 통해 전문적인 답을 얻을 수 있을 뿐 아니라 이에 대한 명확한 근거를 한 화면에서 볼 수 있다"고 전했다. 

엑사원 디스커버리, 'AI 화학자'로 활약

엑사원 디스커버리는 신소재를 비롯한 신물질, 신약 탐색에 활용되는 생성 AI 플랫폼이다. 논문과 특허 등 전문 텍스트뿐 아니라 화학 분자 구조, 차트, 표, 이미지 등 비정형 데이터까지 읽고 학습할 수 있다. 

LG AI연구원은 심층문서이해 기술을 엑사원 디스커버리에 적용했다.

LG AI연구원은 자체 개발한 '심층문서이해(DDU)'기술을 디스커버리에 적용했다. 이를 통해 엑사원은 텍스트뿐 아니라 이미지, 표 등 다양한 형태로 이뤄진 비정형 데이터도 이해할 수 있다. 화학이나 바이오 분야 논문에 적용되는 분자, 구조식, 표, 차트 등 여러 형태 데이터도 이해할 수 있다. 

사용자는 PDF 파일만 올리면, 해당 데이터를 모두 처리할 수 있다. DDU 기술은 올해 2월부터 LG화학 특허 검색 서비스에 적용됐다. 

엑사원 아틀리에, 'AI 작가' 되다

엑사원 아틀리에는 이미지·텍스트를 결합한 데이터 3.5억 장을 학습했다. 사용자가 입력한 텍스트를 이해해 이미지를 만들 수 있고, 이미지를 텍스트로 설명할 수도 있다. 저작권 이슈도 줄였다. 엑사원 아틀리에가 학습한 데이터는 저작권 확보된 것들이다.

관련기사

엑사원 아틀리에는 텍스트와 이미지를 독창적으로 생성할 수 있다.

엑사원 아틀리에는 '제로샷 이미지 캡셔닝'으로 이미지를 이해할 수 있다. 제로샷 이미지 캡셔닝은 LG AI연구원이 자체 개발했다. AI가 기존에 학습한 데이터 기반으로 이미지 배경, 인물, 사물 특징을 스스로 인식할 수 있다. 또 이미지 자체를 이해, 묘사할 수 있다. 부스 관계자는 "한 이미지가 주어지면, 아틀리에는 문장 5개와 키워드 10개를 10초 내에 생성할 수 있다"고 설명했다. 이를 통해 아틀리에는 동화책, 그림, 시 등을 창작할 수 있다.

아틀리에는 사용자 요청 사항도 수행할 수 있다. 예를 들어, 사용자가 마케팅 문구를 만들 경우, 명령어를 길게 입력하지 않아도 된다. 이미지 한장과 요청만 단어로 간단히 입력하면, 아틀리에는 제로샷 이미지 캡셔닝을 통해 사용자 요청을 바로 수행할 수 있다. 부스 관계자는 "타사 AI 모델은 명령어를 길게 받을수록 요청을 원활히 수행할 수 있다면, 아틀리에는 LG AI연구원 기술을 통해 간단한 단어나 이미지만으로 업무 수행을 마칠 수 있다"고 했다.