"스냅드래곤 X2 엘리트 익스트림 CPU, 전세대比 성능 39% 향상"

[스냅드래곤 딥다이브] 프라임/퍼포먼스로 CPU 코어 이원화, 성능·효율 개선

반도체ㆍ디스플레이입력 :2025/11/19 23:05

[샌디에이고(미국)=권봉석 기자] 퀄컴은 지난 해 상반기 스냅드래곤 X 엘리트 탑재 PC 출시 이후 현재까지 CPU 관련 내부 구조나 설계 철학 등 상세 내용을 공개한 적이 없다.

11일(이하 현지시간) 오전 미국 캘리포니아 주 샌디에이고 내 '스냅드래곤 X 엘리트 딥다이브' 행사에서는 프라딥 카나파티필라 퀄컴 엔지니어링 부사장 겸 CPU 아키텍트가 직접 관련 내용을 설명했다.

프라딥 카나파티필라 퀄컴 엔지니어링 부사장 겸 CPU 아키텍트. (사진=지디넷코리아)

퀄컴이 내년 출시를 앞둔 고성능 PC용 시스템반도체(SoC)인 스냅드래곤 X2 엘리트 익스트림은 자체 개발한 오라이언(Oryon) CPU 코어를 큰 폭으로 개선해 성능을 높였다. CPU 코어 수도 전 세대 대비 50% 늘어난 최대 18개로 늘려 다중작업시 효율을 강화했다.

프라딥 카나파티필라 부사장은 "스냅드래곤 X2 엘리트 익스트림에 탑재된 오라이언 CPU는 3세대에 해당하는 제품으로 처음부터 완전히 새로 설계했다. 전세대 대비 성능과 에너지 효율 면에서 큰 도약을 이뤄냈다"고 평가했다.

단일 코어에서 프라임/퍼포먼스 2개 코어로 계층 변경

전세대인 스냅드래곤 X 엘리트는 오라이온 CPU 코어를 한 종류만 탑재했다. 어떤 상황에서도 같은 성능을 내지만 복잡하지 않은 동작을 수행할 때 전력 소모가 커지는 것이 단점이었다.

스냅드래곤 X2 엘리트 익스트림의 CPU 코어 구성도. (사진=지디넷코리아)

스냅드래곤 X2 엘리트 익스트림은 기본 4.4GHz로 작동하는 코어 6개와 L2 캐시 16MB로 구성된 '프라임 클러스터' 2개, 3.6GHz로 작동하는 코어 6개와 L2 캐시 12MB로 구성된 '퍼포먼스 클러스터' 1개 등 총 3개 클러스터로 작동한다.

프라임 클러스터는 최대 성능을 내야 하는 환경에 적합하다. (사진=지디넷코리아)

프라임 클러스터는 최대 5GHz로 작동하며 고성능 작동이 필요한 환경에 적합하다. 반면 퍼포먼스 코어는 성능 극대화가 필요없는 일상적인 작업과 에너지 효율과 저전력 운영 구간에 최적화됐다.

프라임 코어, 조건 분기 예측 성능 향상

프라임 코어는 한 클록당 16개 명령어를 동시에 불러오는 구조로 설계됐다. 또 분기 예측 처리 효율을 높이기 위해 두 클록이 필요한 조건 분기 예측기 등이 포함됐다.

프라딥 카나파티필라 부사장은 "분기 예측에 실패했을 때 이를 다시 예측하는 데 필요한 페널티는 13사이클에 불과하다"고 설명했다.

프라임 코어는 한 클록당 최대 16개 명령어를 불러온다. (사진=지디넷코리아)

정수 연산을 처리하는 실행 유닛은 총 6개이며 64비트 폭으로 설계됐다. 벡터·부동소수점 유닛은 128비트 파이프 4개로 FP32, FP64, BF16, INT 계열 연산을 지원하며, 조건부 벡터 연산 효율을 높였다.

메모리 관리 유닛은 가상화와 2단계 주소 전환을 지원한다. (사진=지디넷코리아)

메모리 관리 유닛은 가상화와 2단계 주소 전환을 지원하며 6웨이 데이터케시 96KB, 로드/스토어 유닛 4개로 빠른 메모리 접근과 캐시 일관성을 보장한다.

행렬 연산 가속기 '매트릭스 엔진' 내장

프라임 클러스터와 퍼포먼스 클러스터에는 AI 연산에 주로 쓰이는 행렬 연산만 전용 처리하는 매트릭스 엔진이 포함된다.

프라딥 카나파티필라 부사장은 "매트릭스 엔진은 CPU 기반 머신러닝과 대규모 행렬 연산에서 성능 향상을 제공하며, 일반 벡터 유닛 대비 폭넓은 연산 처리가 가능하다"고 설명했다.

행렬 연산 가속을 위한 매트릭스 엔진이 별도 탑재된다. (사진=지디넷코리아)

스냅드래곤 X2 엘리트 익스트림의 경우 프라임 클러스터 2개, 퍼포먼스 클러스터 1개 등 총 3개가 내장된다. 매트릭스 엔진과 CPU 코어의 작동 클록은 동기화되지 않으며 이를 통해 전력 소모를 최적화할 수 있다.

프라임 클러스터의 매트릭스 엔진은 8×8 배열, 퍼포먼스 클러스터의 매트릭스 엔진은 4×8 배열 행렬 처리가 가능하며 BF16, FP16, FP32, INT32, INT8 등 다양한 데이터 타입을 지원한다.

현재까지 발견된 보안 취약점 모두 방어

프라임 코어는 신뢰영역(트러스트존) 기반 명령어 실행, 포인터 인증(PAC), 스펙터/멜트다운 등 현재까지 발견된 분기 예측이나 메모리 관련 보안 취약점에 모두 대응했다.

현재까지 발견된 모든 취약점에 대응했다. (사진=지디넷코리아)

메모리 주소마다 꼬리표를 달아 데이터 저장 영역과 실행 영역을 분리하는 메모리 태깅도 포함됐다. 암호화에 필요한 난수생성기(RNG)도 각 CPU 클러스터마다 하나씩 추가됐다.

프라임 코어는 1세대 대비 최대 성능을 39% 향상했다. (사진=지디넷코리아)

프라딥 카나파티필라 부사장은 긱벤치 6.5 자체 테스트 결과를 토대로 "프라임 코어는 1세대에 해당하는 스냅드래곤 X 엘리트 탑재 제품 대비 최대 성능은 39% 늘어났고 같은 성능을 내는 데 필요한 소비 전력은 43% 감소했다"고 설명했다.

퍼포먼스 코어, 2W 미만 저전력 작동에 최적화

퍼포먼스 코어는 전력 효율과 성능의 균형을 추구했다. 소모전력이 2W 미만인 저전력 환경에서 프라임 코어 대비 더 나은 에너지 효율을 지녔다.

관련기사

퍼포먼스 코어는 전력 효율과 성능의 균형을 추구했다. (사진=지디넷코리아)

기본 구조는 모두 비슷하지만 작동 클록은 3.6GHz, L2 캐시 용량은 12MB로 줄이는 등 다이 사이즈 제약이 있는 환경에 더 효과적이다.

프라딥 카나파티필라 부사장은 "프라임 코어는 클록당 처리할 수 있는 명령어(IPC)가 많지만 실제 환경에서는 최고 성능이 필요하지 않은 작업은 더 효율적인 코어에서 실행하는 것이 전체 전력·효율 측면에서 유리하다"고 설명했다.