애플이 인공지능(AI) 기능 고도화를 위해 기기 내 사용자 실제 데이터를 활용하는 새로운 학습 방식을 추진할 예정인 것으로 알려졌다. 이는 그동안 지켜온 합성 데이터 사용 원칙을 수정한 것으로 개인정보 보호 논란이 수면 위로 떠오를 전망이다.
블룸버그는 애플이 사용자 실제 데이터와 합성 데이터를 결합해 AI 모델 훈련을 할 것이란 계획을 담은 내부 자료를 공개했다고 15일 보도했다. 해당 문서명은 '차등 개인정보 보호 기반 집계 경향 분석'이며 새로운 데이터 활용법이 주요 내용이다.
애플의 기존 AI 모델 훈련법은 사용자의 실제 데이터와는 무관한 합성 데이터만을 활용하는 방식이었다. 개인정보 유출 위험은 없었지만, 실제 이용자 언어 패턴이나 문맥 흐름을 반영하는 데 한계가 있었다.

문서에 따르면 새 훈련법은 실제 사용자 데이터를 분석해 이와 비슷한 합성 데이터를 만드는 것이다. 사용자 메시지와 기존 합성 데이터를 비교·분석해 유사도와 반복되는 표현을 파악하는 식이다. 이를 통해 자연스러 언어 흐름과 표현 습관을 AI 모델이 더 정확히 학습하는 것이 목표다. 이 방식은 iOS 18.5와 맥OS 15.5 베타 버전에 우선 적용될 예정인 것으로 전해졌다.
블룸버그는 "이메일처럼 민감한 데이터가 간접적으로 학습 재료로 활용된다"며 "향후 법적·윤리적 논란을 불러올 수 있다"고 지적했다.
관련기사
- 애플, 시총 3조 달러 회복…'관세 일시 면제'에 활짝2025.04.15
- "애플, 새 비전 프로 개발 중…가볍고 저렴하다"2025.04.14
- 시리 출시 미룬 애플, 미·캐나다서 집단소송 당해2025.04.11
- 애플, 내년 아이폰·아이패드 모두 접을까2025.04.10
다수 외신도 애플이 이 변화를 시도하는 배경에는 경쟁사 대비 뒤처진 AI 개발 속도에 대한 위기감이 작용했다고 분석했다. 실제 애플의 AI 비서 '시리(Siri)' 관련 주요 기능 출시가 연이어 연기되면서, 업계에서도 애플을 'AI 후발주자'로 평가하는 분위기다. 최근 시리 부문 핵심 경영진까지 교체됐다.
애플은 "모든 분석 과정에 '차등 개인정보 보호(differential privacy)' 기술을 적용해 사용자 개개인을 식별할 수 없도록 설계했다"며 "수집된 정보는 기기 밖으로 나가지 않는다"고 해명했다. 그러면서 "해당 기능은 사용자가 명시적으로 동의해야만 작동된다"며 "설정 과정에서 이를 비활성화할 수 있다"고 덧붙였다.