루나레이크, 모든 작업 E코어 우선 실행으로 전력 효율 ↑

[인텔 테크투어] 코어 종류 P/E코어로 단순화... P코어서 '하이퍼스레딩' 빠져

반도체ㆍ디스플레이입력 :2024/06/04 12:00

[타이베이(대만)=권봉석 기자] 인텔이 오는 3분기 출시할 모바일(노트북)용 프로세서, '루나레이크'(Lunar Lake)는 x86 프로세서의 약점으로 꼽히던 전력 효율 강화에 초점을 뒀다. 개발 당시 시점에서 가장 우수한 성능을 내는 파운드리인 TSMC 위탁생산을 목표로 했다.

루나레이크는 저전력·고효율을 담당하는 E(에피션트) 코어 '스카이몬트'(Skymont)를 4개 탑재한다. 전작인 메테오레이크와 달리 저전력 E코어 아일랜드(2코어)는 빠졌다. 모든 작업은 기본적으로 E코어 4개에서 실행해 전력 소모를 최소화했다.

루나레이크에 탑재될 E(에피션트) 코어 '스카이몬트'. 전력 효율 향상에 중점을 뒀다. (사진=지디넷코리아)

특히 저전력·고효율을 담당하는 E(에피션트) 코어 '스카이몬트'는 비슷한 전력 소모에서 전세대 고성능 담당 P(퍼포먼스) 코어 이상의 성능을 낼 정도로 강화됐다.

■ "E코어 '스카이몬트', 전작 대비 최대 2.9배 성능 향상"

지난 주 진행된 '테크투어 타이완' 행사에서 스테판 로빈슨(Stephen Robinson) 인텔 수석 아키텍트겸 펠로우는 "스카이몬트는 전작 메테오레이크에 탑재된 E코어(크레스트몬트) 대비 같은 전력에서 최대 2.9배 더 높은 성능을 낸다"고 설명했다.

스카이몬트 코어는 분기 예측 성능을 강화했다. (사진=지디넷코리아)

성능 개선에 영향을 준 가장 큰 요소는 바로 다음 명령어를 예측하는 '분기 예측' 확대다. 또 복잡한 명령어를 분해하고 해석해 실행 다음 단계로 전달하는 장치인 '디코더'를 한 개 더 늘렸다.

스카이몬트 코어의 비순차실행(OOE) 명령어가 최대 8개로 확대됐다. (사진=지디넷코리아)

비순차실행(OOE)은 전후 연산 결과에 영향을 받지 않는 명령어를 앞질러 처리해 클록당 처리 명령어 수(IPC)를 향상시킨다. 스카이몬트는 동시 실행할 수 있는 비순차실행 명령어를 메테오레이크(6개) 대비 2개 늘어난 8개로 확대했다.

AI 연산 속도를 올리기 위한 벡터 연산도 강화했다. (사진=지디넷코리아)

AI 연산 속도를 올리기 위한 벡터 연산도 강화됐다. AI 연산에 주로 쓰이는 128비트 부동소수점(Float) 처리기를 4개 탑재하고 부동소수점 곱셈(FMUL), 덧셈(FADD), 곱셈·덧셈(FMA) 명령어의 지연시간은 낮췄다.

■ 4코어 모두 활용시 전작 대비 최대 4배 성능 향상

이런 개선이 더해진 결과 스카이몬트 코어의 연산 성능은 메테오레이크에 탑재되던 저전력 아일랜드 E코어 대비 정수 기준 1.38배, 실수(부동소수점) 기준 1.68배 높아졌다.

코어 4개 구성 스카이몬트가 메테오레이크 저전력 아일랜드 E코어(2코어)보다 1/3 더 낮은 전력을 쓴다. (사진=지디넷코리아)

단일 작업 기준으로 스카이몬트 코어 4개로 구성한 클러스터 성능은 듀얼코어(2코어)인 메테오레이크 저전력 아일랜드 E코어 대비 최대 2배 향상됐다.

모든 코어 활용시 스카이몬트 클러스터(4코어) 성능은 최대 4배 확대된다. (사진=지디넷코리아)

코어 수가 더 늘어났지만 소비 전력은 1/3 줄었고 같은 전력 공급시 성능은 1.7배 늘어났다. 모든 코어를 활용할 때 성능은 최대 4배 향상되며 동일 전력 대비 성능은 최대 2.9배 높아졌다.

■ 데스크톱용 P코어보다 같은 전력에서 더 높은 성능

스테판 로빈슨 펠로우는 "스카이몬트 4코어는 데스크톱용 13세대 코어 프로세서(랩터레이크)에 탑재되는 P코어, 랩터코브(Raptor Cove)와 비교했을 때 오히려 더 높은 성능을 내기도 한다"고 설명했다.

스카이몬트 단일 코어 작동시 랩터코브(P코어) 대비 전력 효율이 더 높다. (사진=지디넷코리아)

그는 "최대 작동 클록에서는 랩터코브가 6GHz를 넘어설 수 있는 반면 스카이몬트는 6GHz를 넘지 못한다. 그러나 단일 작업 처리시 최대 성능 면에서는 스카이몬트가 같은 전력 대비 더 나은 성능을 낸다"고 밝혔다.

스테판 로빈슨 펠로우는 ”스카이몬트는 과거 충분히 처리할 수 없었던 작업을 보다 원활히 처리할 것”이라고 밝혔다. (사진=지디넷코리아)

이어 "메테오레이크의 저전력 아일랜드 E코어는 넷플릭스나 유튜브 영상 재생은 원활했지만 마이크로소프트 팀즈 등에서는 충분한 성능을 내지 못했다. 그러나 이제는 이런 작업도 E코어로 충분히 처리할 수 있을 것"이라고 덧붙였다.

루나레이크는 단시간 안에 빨리 처리해야 하는 작업에만 P(퍼포먼스) 코어 '라이언코브'(Lion Cove)를 활용한다. P코어는 총 4개만 탑재되는 데다 최대 작동 클록은 메테오레이크 탑재 P코어보다 낮지만 IPC 향상으로 이를 보완했다는 것이 인텔 설명이다.

P코어 '라이언코브'. 전력과 면적 효율성 개선에 중점을 뒀다. (사진=지디넷코리아)

오리 렘펠(Ori Lempel) 인텔 수석 엔지니어는 "작동 클록이 낮아질 수 있지만 IPC를 높이면 성능 향상은 자연스럽게 따라온다"며 "라이언코브의 IPC는 메테오레이크 탑재 P코어 '레드우드코브' 대비 최대 14% 향상됐다"고 밝혔다.

또 하나 특징은 코어 한 개를 두 개처럼 활용하는 기술 '하이퍼스레딩'을 더 이상 쓰지 않는다는 것이다. 오리 렘펠 인텔 수석 엔지니어는 "개발 도중 여러 요소를 고려한 결과 루나레이크에 탑재되는 라이언코브에서는 지원하지 않는 것으로 결정했다"고 밝혔다.

P코어 '라이언코브'는 단일 작업 최적화로 하이퍼스레딩 유효화시 대비 더 높은 성능을 낼 것으로 전망된다. (사진=지디넷코리아)

그는 "하이퍼스레딩에는 댓가가 따른다. 명령어를 처리하는 절차인 파이프라인이 길어져 속도를 떨어뜨리며 보안 문제도 있다. 라이언코브를 단일 작업에 최적화한 결과 더 적은 면적과 전력에서 더 높은 속도를 낼 수 있다"고 설명했다.

관련기사

■ "제품 특성에 맞는 다양한 '라이언코브' 등장할 것"

2021년 출시된 12세대 코어 프로세서(엘더레이크)를 시작으로 지금까지 E코어는 4개를 기준으로 클러스터 한 개를 구성했다. 스티븐 로빈슨은 "현 세대는 4개 묶음이 여전히 유효하며 2개, 혹은 6개 등 축소나 확대를 고려하지 않는다"고 밝혔다.

오리 렘펠 수석 엔지니어는 ”제품 특성에 맞는 다양한 P코어 변종이 등장할 것”이라고 설명했다. (사진=지디넷코리아)

라이언코브는 루나레이크 뿐만 아니라 4분기 출시될 데스크톱PC용 프로세서 '애로레이크' 등에도 적합하게 설계됐다. 오리 렘펠 수석 엔지니어는 "예전과 달리 서버나 데스크톱PC, 노트북 등 제품 특성에 맞는 다양한 P코어 변종이 등장할 것"이라고 설명했다.