"특화 데이터셋, 생성 AI 사업 성패 가른다"

"생성 AI 사업 성패는 특화된 데이터셋에 달렸다. 특화된 데이터는 사용자 접근성을 높이는 데 가장 필요한 수단이다"

이세영 뤼튼테크놀로지스 대표는 31일 서울 인터컨티넨탈 파르나스에서 '생성 AI 아시아 2023 사전 세미나'을 열고 "생성 AI 서비스 수익 창출을 위해서는 범용 데이터셋보다 한 영역에 집중한 특화용 데이터를 쌓아야 한다"고 강조했다.

이 대표는 챗GPT를 예로 들었다. 그는 "챗GPT는 기사를 쓸 수 있지만, 바로 내놓을 수 있는 기사를 낼 순 없다"고 말했다. 챗GPT에 탑재된 GPT-3.5 모델은 기사 작성용 데이터가 아닌 범용 언어 데이터셋으로 이뤄졌다.

이 대표는 "생성 AI에 들어간 데이터셋 규모가 크다고 반드시 사업에 좋은 것은 아니다"며 "생성 AI 기업이 살아남으려면 특정 데이터셋을 전문가 지식수준과 비슷할 정도로 갖춰야 한다고" 말했다.

그는 "현재 기업이 데이터셋은 많이 갖고 있지만, 한 분야에 특화한 데이터를 가진 기업은 적다"고 했다. 이 대표는 "앞으로 많은 업체가 생성 AI 비즈니스에 뛰어들 것이다. 기업이 치열한 시장에서 사용자 눈에 띄려면 한 우물만 판 데이터셋을 필수로 갖춰야 한다"고 말했다.

이세영 대표는 기업마다 특화된 데이터셋이 있으면, 생성 AI 산업 독점을 막을 수 있다는 입장이다.

현재 네이버, 카카오, KT 등 국내 빅테크 기업은 자체적으로 초거대 AI 모델을 갖고 있다. 대기업은 언제든지 자사 모델로 다양한 애플리케이션을 만들 수 있다.

"특화 데이터셋, 생성 AI 사업 성패 가른다"

관련기사

지금 뜨는 기사

이시각 헤드라인

[단독] 하정우, 국가AI전략위로…李정부 AI 삼각축 재편 마무리

젠슨 황 삼소회동 그 식당, 네이버 '페이스사인' 지금도 쓸까

"한국 첫 오프라인 상륙" 매진 행렬…쿠로게임즈 '퍼니싱' 팝업스토어 가보니

"졌지만 잘 싸웠다"...광화문 월드컵 생중계 현장에 퍼진 탄성과 함성

ZDNet Power Center