"앞으로 합성 데이터 설계는 인공지능(AI) 경쟁력 핵심 요소가 될 것입니다. 프라이버시 보호와 비용 효율성을 동시에 충족시키는 대안으로 자리 잡을 것입니다. 대기업뿐 아니라 스타트업도 합성데이터로 우수한 서비스를 개발할 수 있을 것입니다."
엔비디아 키릿 타다카 인공지능(AI)·머신러닝(ML) 프로덕트 리더는 25일 한국콘텐츠진흥원이 서울 성수동 피치스 도원에서 개최한 '2025 스타트업콘'에서 합성 데이터 경쟁력을 이같이 밝혔다.
타다카 리더는 AI 시대 데이터 확보 한계와 개인정보 보호 규제를 동시에 해결하기 위한 전략으로 합성 데이터가 떠올랐다고 강조했다. 이를 통해 모델 성능을 높이면서도 사용자 정보 유출 위험을 줄일 수 있어서다.

그는 "개발자들은 실제 사용자 정보나 데이터 대신 합성 데이터를 설계하기 시작했다"며 "맞춤형 모델 학습 방안을 새롭게 도입하고 있는 추세"라고 했다.
타다카 리더는 적절한 데이터 확보 어려움으로 인해 AI 프로젝트가 초기 단계에서 막힌다고 지적했다. 그는 "작업 초기부터 AI에 넣을 데이터가 아예 없거나 접근이 제한되는 경우가 많다"며 "데이터가 있어도 개인정보 때문에 활용할 수 없는 이슈가 대표적"이라고 말했다. 이어 "이런 상황에서 합성 데이터가 해결책일 수밖에 없다"고 덧붙였다.
타다카 리더는 합성 데이터가 모델 성능을 높이기 위한 데이터셋 설계 전략과도 맞닿아 있다고 강조했다. 특정 도메인에 특화된 합성 데이터셋을 설계하면 작은 모델도 빠르고 저렴하게 고성능을 낼 수 있다는 이유에서다. 그는 "특히 스타트업은 이 방식을 활용해 대규모 학습 비용을 줄이면서도 차별화된 AI 서비스를 개발할 수 있을 것"이라고 말했다.
타다카 리더는 합성 데이터가 추천 시스템과 콘텐츠 추천 모델을 초기 단계부터 빠르게 고도화할 수 있다고 주장했다. 그는 "실제 사용자 데이터를 기다리지 않아도 가상의 사용자 유형을 만들어 추천 모델을 개발할 수 있기 때문"이라고 이유를 밝혔다.
관련기사
- "AI가 핵심 자산"…세일즈포스, '에이전트포스' 활용 전략 공개2025.09.25
- 가트너 "합성 데이터 사용도 전략 필요…수익성 따져야"2025.09.07
- "질병 진단부터 영화 조명까지"…엔비디아, 합성 데이터로 산업 구조 뒤집는다2025.06.17
- 합성 데이터로 탄생한 '그록3'…환각·결함 우려 괜찮나2025.02.18

이어 "합성 데이터는 페르소나 기반 개인화, 틈새 행동 패턴을 반영하는 도메인 맞춤화, 지역 문화와 언어를 고려한 언어 기반 개인화를 수행할 수 있다"고 강조했다.
또 타다카 리더는 프라이버시 보호가 합성 데이터 확산을 이끄는 핵심 요인으로 떠오르고 있다는 점도 알렸다. 그는 "실제 사용자 데이터를 대량으로 보관하면 보안 사고 위험과 규제 부담이 커진다"며 "합성 데이터는 보안 시스템을 강화하거나 개인정보를 주기적으로 삭제하는 절차를 간소화할 수 있을 것"이라고 내다봤다.