"생성 AI 사업 성패는 특화된 데이터셋에 달렸다. 특화된 데이터는 사용자 접근성을 높이는 데 가장 필요한 수단이다"
이세영 뤼튼테크놀로지스 대표는 31일 서울 인터컨티넨탈 파르나스에서 '생성 AI 아시아 2023 사전 세미나'을 열고 "생성 AI 서비스 수익 창출을 위해서는 범용 데이터셋보다 한 영역에 집중한 특화용 데이터를 쌓아야 한다"고 강조했다.
이 대표는 챗GPT를 예로 들었다. 그는 "챗GPT는 기사를 쓸 수 있지만, 바로 내놓을 수 있는 기사를 낼 순 없다"고 말했다. 챗GPT에 탑재된 GPT-3.5 모델은 기사 작성용 데이터가 아닌 범용 언어 데이터셋으로 이뤄졌다.
이 대표는 "생성 AI에 들어간 데이터셋 규모가 크다고 반드시 사업에 좋은 것은 아니다"며 "생성 AI 기업이 살아남으려면 특정 데이터셋을 전문가 지식수준과 비슷할 정도로 갖춰야 한다고" 말했다.
그는 "현재 기업이 데이터셋은 많이 갖고 있지만, 한 분야에 특화한 데이터를 가진 기업은 적다"고 했다. 이 대표는 "앞으로 많은 업체가 생성 AI 비즈니스에 뛰어들 것이다. 기업이 치열한 시장에서 사용자 눈에 띄려면 한 우물만 판 데이터셋을 필수로 갖춰야 한다"고 말했다.
이세영 대표는 기업마다 특화된 데이터셋이 있으면, 생성 AI 산업 독점을 막을 수 있다는 입장이다.
현재 네이버, 카카오, KT 등 국내 빅테크 기업은 자체적으로 초거대 AI 모델을 갖고 있다. 대기업은 언제든지 자사 모델로 다양한 애플리케이션을 만들 수 있다.
관련기사
- 튜닙, 뤼튼 서비스에 'AI 윤리 측정 모델' 제공2022.12.22
- 뤼튼, 생성 AI '뤼튼트레이닝'으로 CES 2023 혁신상 수상2023.01.05
- 오픈AI, 챗GPT 코드 작성 능력 높이려 개발자 대거 고용2023.01.31
- 中 바이두도 챗GPT 같은 챗봇 만든다2023.01.30
이 대표는 "스타트업이나 중견기업은 초거대 AI 모델 제작 비용과 시간을 감당하기 힘들다"며 "결국 생성 AI 시장도 독과점 형태로 굳어질 수 있다"고 내다봤다. 이 대표는 "이를 방지하기 위해 생성 AI 기업들은 자신들만의 거점 시장을 찾으면서 데이터셋을 쌓는 게 중요하다"며 "기술 발전에 대응해 수익낼 수 있는 유일한 방법이다"고 말했다.
뤼튼테크놀로지스는 생성 AI를 기반으로 광고 문구를 비롯해 다양한 글 초안을 작성하는 AI 콘텐츠 플랫폼 '뤼튼'과 AI 글쓰기 연습 플랫폼인 '뤼튼 트레이닝'을 제공하는 기업이다. 최근 미국 라스베이거스에서 열린 CES 2023에서 혁신상을 받았다.