의료 및 산업분야에 최적화된 비(非)라벨링 데이터 표준화 솔루션이 출시했다.
미소정보기술(대표 안동욱)은 대규모언어모델(LLM) AI 구축과 소규모언어모델(sLLM) AI 구축시 양질의 빅데이터 확보를 위한 솔루션 ‘데이터스캔’을 선보인다고 15일 밝혔다.
‘데이터스캔’은 의료 및 산업분야에서 사람의 손으로 가공된 라벨링 데이터(지도학습)가 아닌 챗GPT등 초거대AI 개발에 필수인 양질의 빅데이터를 확보할 수 있는 비라벨링 데이터 표준화 솔루션이다.
초거대AI 사전학습에 필요한 빅데이터 구축을 위해 데이터 등록부터 분류체계, 단어사전 구축 통한 자연어 처리 및 분류분석, 텍스트분석, 산업별 적용 도메인에 따른 데이터 후처리 등을 실시간 분석한다.
기업·공공기관의 내부 문서 보안이 강화된 패브릭기반 멀티모달 데이터 플랫폼 ‘스마트빅(smart BIG)’을 통해 LLM, sLLM구축시 고도화된 언어처리 기술을 원스톱으로 제공한다.
일상생활과 직결되는 의료분야에서는 의료영상 판독을 통한 건강검진·진료 소견서 작성, 과거 진료기록 요약, 치료 방법·처방전, 개인건강관리, 반려동물 질병 상담 등 활용할 수 있다.
금융 부분은 고객상담, 금융상품 추천, 신용평가, 금융사고 감지 등 금융전반의 AI서비스에 활용하며, 법률 분야에서는 계약서, 소장, 법조문 제시, 판결문(법원)등 서류 작성 시간을 줄이고 유사 판례를 쉽게 찾아주는 서비스 등을 통해 업무 효율성과 국민 편의성까지 높아질 것으로 기대하고 있다.
현재 초거대AI에 필요한 ‘비라벨링 데이터’는 의료 및 산업분야에 부족한 실정이다. 단순·반복 작업 중심이었던 라벨링 데이터 중심의 AI 학습용 데이터로는 사람이 직접 라벨링 하지 않고 비지도학습 즉 모델이 스스로 예측하며 학습하는 방식의‘챗GPT’ 같은 초거대 AI를 지원하기 어렵다. 국가 차원의 초거대 AI 학습용 핵심 데이터 구축으로 빠르게 전환이 필요하다.
미소정보기술은 주력사업인 디지털 헬스케어사업 호조 및 대학병원 및 공공, 의료기관등 의료데이터 개방에 맞춰 임상연구분석에 최적화된 워크플로 전과정을 통합 제공하는 ‘서비스형 임상시험(CRaaS)’ 솔루션 고도화, 정형, 비정형, 텍스트, 비디오, 오디오 등 데이터들을 통합하고 인터랙션을 제공하는 멀티모달 데이터 플랫폼(MDP) 사업에 집중하고 있다.
관련기사
- 미소정보기술-모리트, 디지털트윈 AI 수질관리 시스템 개발2024.01.16
- 미소정보기술, 멀티모달 기술로 헬스케어 사업 고도화2024.01.09
- 미소정보기술, 임상연구 통합솔루션 ‘CRaaS’ 공개2023.12.20
- 미소정보기술, 의료데이터 심의시스템 ‘스마트DRB’ 출시2023.12.04
미소정보기술은 의료데이터에서 산업데이터까지 데이터 구분없이 분석이 가능한 전문 도메인 날리지와 패브릭기반 멀티모달 데이터 플랫폼 ‘스마트빅’을 통해 기업 및 공공기관에 한국형 챗GPT, LLM, Sllm등 생성형AI 서비스 품질을 높일 수 있도록 고도화에 집중 투자하고 있다.
미소정보기술 안동욱 대표이사는“생성형AI시대를 맞아 양질의 데이터는 AI경쟁력의 핵심이라며 의료, 산업 데이터분석 및 멀티모달 데이터 플랫폼으로 똘똘한 데이터를 제공해 초거대AI 기업들의 경쟁력을 지원하는 데이터 인에이블러 역할을 담당할 것”이라고 말했다.