WWDC23서 애플이 강조하지 않은 AI 기능들

컴퓨팅입력 :2023/06/09 13:31    수정: 2023/06/09 16:38

애플은 올해 세계개발자대회(WWDC) 행사에서 '생성 AI'란 말을 한번도 언급하지 않았지만, 제품 곳곳에 생성 AI 기능을 녹여냈다.

7일 미국 지디넷은 애플이 WWDC23에서 발표한 하드웨어와 소프트웨어의 새로운 고급 AI 기능을 정리했다.

애플은 전면에 내세우지 않았지만, 비전 프로, 에어팟, 아이패드OS, iOS 등에서 최신 AI 기술을 활용한 새 기능을 쉽게 찾을 수 있다.

WWDC23 무대에 입장하는 팀 쿡 애플 CEO

■ 비전 프로 '디지털 페르소나'

올해 애플 개발자 행사의 하이라이트는 혼합현실(MR) 헤드셋인 '애플 비전 프로'였다. 증강현실과 가상현실을 혼합해 일상적 활동이나 엔터테인먼트를 몰입형 경험으로 이용하게 한다.

비전프로의 페이스타임은 헤드셋을 착용하고 상대방의 실물크기 타일로 통화하게 한다. 각 사람의 오디오는 공간음향을 활용해 개별 타일 위치 혹은 방향에서 나온다.

비전 프로용 3D 디지털 페르소나를 만드는 모습

통화중인 사람은 비전 프로 착용자의 3D 디지털 페르소나를 보며 통화한다. 이 디지털 페르소나는 최신 머신러닝 기술을 사용해 초기 얼굴 스캔을 거쳐 3D 아바타를 생성한다. 헤드셋의 센서는 착용자의 얼굴과 손 움직임을 반영해 아바타에 정보를 전달하고, 가상 아바타는 실제 사용자의 움직임에 따라 그대로 움직인다.

헤드셋의 손, 시선 등을 추적하는 기술과 음성 명령도 트랜스포머 모델 기반으로 작동한다.

■ 에어팟 맞춤형 볼륨

에어팟의 소프트웨어도 머신러닝 기술을 사용한다.

에어팟프로2는 맞춤형 볼륨을 갖추게 된다. 시간이 지나면서 환경 조건과 청취 선호도를 학습해 사용자의 볼륨을 알아서 조정한다.

에어팟프로2는 맞춤형 볼륨과 적응형 오디오를 제공한다.

적응형 오디오도 생긴다. 에어팟프로의 주변음 허용 모드와 액티브노이즈캔슬링 기능을 혼합해 주변 환경에 가장 적합한 소음제어 상태로 조정한다.

대화 인식 기능도 있다. 에어팟프로2를 착용한 상태에서 주변 사람과 대화를 시작하면, 에어팟이 대화를 인식해 볼륨을 낮추고 앞사람의 목소리를 높이는 한편 배경 소음을 줄인다.

■ 아이패드OS 17 자동완성 기능

아이패드OS 17은 새로운 건강 앱과 홈화면에서 스마트홈 항목을 제어하는 기능 등을 포함한다.

이 가운데 PDF 기능 향상이 눈에 띈다. '향상된 자동완성'이란 이름의 이 기능은 아이패드에서 PDF 문서를 읽을 때, 텍스트를 입력해야 하는 필드를 식별한다.

아이패드OS 17 PDF 자동 완성

문서 변환없이 텍스트 항목을 입력할 수 있으며, 연락처에 저장된 정보를 가져와 개인정보를 자동으로 채워준다.

PDF 문서 내 영역 인식과 개인정보 자동 완성 등이 최신 머신러닝 기술을 활용한다.

■ iOS 17 저널 앱

iOS 17은 개인의 정신, 신체 건강을 개선하기 위해 일상 활동을 기록하는 '저널'이란 앱을 새로 탑재한다.

저널 앱의 주요 기능 중 하나는 사진, 음악, 위치 등 다른 앱의 활동 정보를 기반으로 개인화된 제안을 제공하는 것이다.

iOS 17 저널 앱

사용자의 행동을 분석하고, 다음 결과를 기반으로 자연어 프롬프트를 생성한다.

이 기능도 적절한 데이터 분석과 정보 생성을 해야 하므로 최신 머신러닝 기술을 활용한다

■ iOS 자동 수정 향상

iOS 17의 자동 수정 기능과 단어 예측 기능이 트랜스포머 언어 모델을 통해 대폭 향상됐다. 애플이 명시적으로 '트랜스포머 언어 모델'이란 용어를 사용한 기능이다.

사용자가 키패드로 입력할 때 단어를 예측하고 자동으로 완성해주는데, 수정의 범위가 한 문장 단위로 커졌다.

스페이스바를 탭하는 수준으로 자동 완성된 텍스트를 입력할 수 있다.

관련기사

받아쓰기 역시 새로운 음성인식 모델을 홯용해 더 정확해졌다.

iOS 17의 자동 수정 기능에 활용된 트랜스포머 언어 모델은 처음부터 다중 언어 활용을 위해 만들어졌다. 애플은 영어뿐 아니라 한국어를 포함한 27개 언어를 학습시켰다. 애플의 트랜스포머 언어모델은 3개의 언어그룹을 갖는데 한국어, 일본어, 중국어 등의 언어모델, 라틴어 계열 언어 모델, 키릴 문자계열 언어모델 등을 갖는다.