퀄컴 "지속 가능성 위해 클라우드-기기 간 AI 분산 처리 필요"

"퀄컴 AI 허브로 개발자 지원... 책임있는 AI 위한 업계 표준 개발도 참여"

반도체ㆍ디스플레이입력 :2024/09/08 16:14

"2007년 애플 아이폰으로 터치 인터페이스가 보편화됐고 앞으로는 생성 AI와 음성 비서가 활성화되면 음성으로 기기를 조작하게 될 것입니다. AI는 분명히 이용자 인터페이스와 경험을 바꾸고 있고 퀄컴도 이에 맞춰 지속적으로 변화하기 위해 노력할 것입니다."

지난 6일 오전 서울 한남동 그랜드 하얏트 호텔에서 국내 기자단과 만난 두르가 말라디(Durga Maladi) 퀄컴 기술기획·엣지 솔루션 부문 본부장(수석부사장)이 이렇게 강조했다.

두르가 말라디(Durga Maladi) 퀄컴 기술기획·엣지 솔루션 부문 본부장. (사진=퀄컴)

퀄컴은 비용과 전력소모, 지연시간에서 이점을 지닌 온디바이스 AI를 다양한 영역으로 확대중이다. 스마트폰용 스냅드래곤 SoC(시스템반도체)를 시작으로 지난 6월에는 자체 개발한 CPU IP '오라이온'(Oryon)을 탑재한 PC용 칩인 '스냅드래곤 X 엘리트' 첫 제품을 출시했다.

이날 두르가 말라디 본부장은 "시장조사업체 맥킨지는 AI가 영국 한해 GDP(국민총생산)과 맞먹는 4조 4천억 달러(약 5천839조원) 가량의 영향력을 지니고 있다고 평가했다. 그만큼 커다란 잠재력을 지녔지만 동시에 극복해야 할 과제도 늘어났다"고 밝혔다.

■ "AI 처리, 클라우드와 기기간 분산 처리 필요"

두르가 말라디 본부장은 "음성과 영상, 이미지, 텍스트 등을 활용하는 AI 추론을 클라우드에서만 수행하면 지연시간과 소모 비용이 커진다. 모든 AI 활동을 클라우드에서만 실행하면 2030년까지 AI 관련 소모 전력이 글로벌 전체 전기 생산량의 3.5%를 차지할 것"이라고 지적했다.

퀄컴이 추진 중인 전략은 클라우드 도움 없이 PC나 스마트폰에서 직접 AI 응용프로그램을 실행하는 분산형 AI다.

두르가 말라디 본부장은 ”AI 분사 처리는 각종 비용과 지연 시간을 크게 낮출 것”이라고 설명했다. (사진=지디넷코리아)

두르가 말라디 본부장은 "온디바이스 AI는 기기에 저장된 데이터를 이용해 작동하기 때문에 사생활 침해나 보안 우려가 없고 지연 시간을 크게 줄이면서 LLM(거대언어모델)을 실행할 수 있다"고 설명했다.

단 AI에서 클라우드 역할도 여전히 필요하다. 클라우드에서 구동되는 고성능 프로세서와 AI 가속기, 빅데이터를 활용해 훨씬 더 거대한 모델을 이용할 수 있고 기기 상에서 실행하는 AI 모델 역시 클라우드에서 먼저 추론과 훈련 과정을 거치기 때문이다.

■ "최신 AI 모델, 매개변수 줄어도 성능은 향상"

온디바이스 AI가 중요해지는 요인은 또 있다. 보다 적은 용량과 매개변수(파라미터)를 내장한 모델이 이전 출시된 AI 모델 성능을 앞서가고 있기 때문이다. 기기상에서 직접 실행되는 모델도 과거 클라우드에서 구동되던 모델과 비슷한 성능을 낼 수 있다.

LLM(거대언어모델)별 내장 매개변수와 성능 비교. (자료=퀄컴)

두르가 말라디 본부장은 "2년 전 등장한 챗GPT는 1천750억 개 매개변수 기반 'GPT-3'를 이용했다. 그러나 올해 6월 공개된 메타 최신 모델 '라마3'(Llama 3)는 상대적으로 적은 80억 개 매개변수로 GPT-3 대비 더 나은 성능을 낸다"고 설명했다.

이어 "퀄컴은 2010년부터 현재까지 AI 관련 투자를 지속했고 현재는 스마트폰부터 PC, XR 기기, 개인/산업용 IoT 기기에서 오토모티브까지 다양한 기기에서 생성 AI를 실행 가능한 다양한 프로세서를 시장에 출시하고 있다"고 덧붙였다.

■ "윈도 PC와 안드로이드 스마트폰에서 AI 지원"

퀄컴이 6월 출시한 PC용 SoC인 스냅드래곤 X 엘리트/플러스는 마이크로소프트가 추진하는 새 플랫폼 '코파일럿+(플러스)'를 가장 먼저 지원했다. 현재 국내외 주요 제조사가 이를 탑재한 PC 21종을 판매중이다.

퀄컴 스냅드래곤 X 엘리트/플러스 SoC. (사진=지디넷코리아)

코파일럿+ PC는 텍스트 요약, 문서 생성, 문서 형태 변환 등 업무에 필요한 기능과 함께 실시간 자막 기능 '라이브 캡션' 등 다양한 AI 기능을 지원한다. 최대 100억 개 매개변수를 내장한 AI 모델을 실행할 수 있다.

삼성전자 갤럭시 폴더블 스마트폰 신제품에 스냅드래곤8 3세대가 전량 공급된다. (사진=퀄컴)

최근 출시된 삼성전자 폴더블 스마트폰인 갤럭시Z플립6, 갤럭시Z폴드6도 갤럭시 스마트폰에 최적화된 퀄컴 스냅드래곤 플랫폼으로 실시간 통역, 서클 투 서치, 포토 어시스트, 스케치 투 이미지 등 다양한 AI 기능을 구현했다.

■ "퀄컴 AI 허브로 개발자 지원... 경기 분석용 앱도 개선"

프로세서의 AI 기능을 활용하려면 이를 살릴 수 있는 개발자 지원도 반드시 필요하다. 퀄컴은 지난 2월부터 온디바이스 AI 구현에 필요한 리소스와 도구, 서비스를 제공하는 웹사이트 '퀄컴 AI 허브'를 운영중이다.

퀄컴 AI 허브는 스마트폰/PC용 앱 개발자에 최적화된 AI 모델을 지원한다. (사진=퀄컴)

퀄컴 AI 허브는 퀄컴이 제공하는 100개 이상의 AI 모델 뿐만 아니라 개발자가 만든 모델을 불러와 스냅드래곤/퀄컴 플랫폼에 최적화할 수 있다. 클라우드에서 5분 안에 모델을 테스트할 수 있는 기능도 지원한다.

두르가 말라디 본부장은 한 AI 앱 개발자가 퀄컴 AI 허브를 활용해 앱 성능을 개선한 사례도 소개했다. 이 개발자는 스포츠 경기 시청시 영상 처리와 생성 AI 분석으로 선수 프로필을 보여주는 앱을 만들었지만 초반 이용자 반응은 좋지 않았다.

스냅드래곤 X 개발자 에디션 탑재 윈도 개발 키트. (사진=퀄컴)

두르가 말라디 본부장은 "이 개발자가 퀄컴 AI 허브 최적화 기능으로 기존 대비 지연 시간을 50분의 1로 단축하자 일간 10만 다운로드, 1주일만에 100만 다운로드를 돌파했다. 이는 개발자가 겪는 문제를 퀄컴 AI 허브로 해결한 좋온 사례"라고 말했다.

■ "AI 활용시 사회/윤리 문제 해결에도 무게"

퀄컴은 이날 AI 구현과 활용을 넘어 AI 활용시 발생할 수 있는 사생활 침해, 권리 침해 등 각종 문제를 해결하기 위한 '책임있는 AI'에도 중점을 두겠다고 밝혔다.

퀄컴은 현재 ML커먼스의 AI 안전 분야 의장사로 참여중이다. (자료=퀄컴)

두르가 말라디 본부장은 "퀄컴은 기기 내 이용자 데이터를 이용할 때 개인정보 보호와 보안 확보에 최선을 다하고 있으며 AI 관련 비영리 업계 단체 'ML커먼스' 내 AI 안전 기준 컨소시엄에도 참여중"이라고 설명했다.

관련기사

퀄컴은 현재 ML커먼스의 AI 안전 관련 의장사로 참여해 엔트로피, 구글, 메타, 마이크로소프트, 엔비디아, 오픈AI 등 다양한 파트너 기업과 AI 모델 관련 단일 표준 도출도 추진중이다.

두르가 말라디 본부장은 ”퀄컴은 AI 활용시 발생하는 사회/윤리적 문제 해결과 예방을 위해 책임있는 AI에 중점을 둘 것”이라고 밝혔다. (사진=지디넷코리아)

두르가 말라디 본부장은 "AI 모델 안전성 관련 표준이 마련되면 AI 모델을 만드는 기업이나 개인이 ML커먼스의 'AI 안전 벤치마크'를 이용해 출시 전 안전도를 스스로 평가할 수 있을 것"이라고 밝혔다.