인텔 "루나레이크, P/E코어 작업 배분 효율화로 전력 절감"

[인텔 테크투어] 마이크로소프트 팀즈서 소모 전력 최대 35% 낮춰

반도체ㆍ디스플레이입력 :2024/06/04 12:00

[타이베이(대만)=권봉석 기자] 인텔은 12세대 코어 프로세서(엘더레이크)부터 고성능 P(퍼포먼스) 코어, 저전력·고효율 기반 E(에피션트) 코어를 혼합한 하이브리드 코어를 투입했다.

윈도 운영체제는 각 코어의 성능과 실행하는 작업의 상태를 파악해 윈도 운영체제가 적절한 코어에 작업을 배정하고 원활하게 실행될 수 있도록 할 필요가 있었다. 이 과정에서 새롭게 등장한 것이 '스레드 디렉터'(Thread Director)다.

12세대 코어 프로세서 이후 탑재된 스레드 디렉터. (사진=지디넷코리아)

지난 주 진행된 '테크투어 타이완' 행사에서 라즈쉬리 차북스와(Rajshree Chabukswar) 인텔 클라이언트 컴퓨팅 그룹 펠로우는 "윈도 운영체제는 PC 제조사나 OEM의 의도, 어댑터 연결 유무에 따른 코어 최대 성능까지 파악할 수 없으며 이를 전달하는 것이 스레드 디렉터"라고 설명했다.

■ 코어 배분 방식, 프로세서 개발 의도에 따라 변화

라즈쉬리 차북스와 펠로우는 "CPU의 IPC(클록당 처리 명렁어)는 전력 소모 상태에 따라 바뀐다. 어떤 상황에서는 E코어가 P코어보다 더 빠르고 효율적일 수 있다. 스레드 디렉터는 이를 파악해 윈도 운영체제에 전달한다"고 설명했다.

하이브리드 구조를 처음 적용한 12세대 코어 프로세서(엘더레이크). (자료=인텔)

스레드 디렉터는 코어 프로세서 출시 세대마다 작동 방식과 내부 처리 우선 순위에 변화가 있었다. 12/13세대 코어 프로세서는 다중 작업 역량과 성능을 중시했기 때문에 거의 모든 작업 실행시 P코어를 우선했다.

프로세서 세대 별 스레드 디렉터 작동 방식 변화. (사진=지디넷코리아)

코어 울트라 시리즈1(메테오레이크)은 전력 효율성을 우선했다. P코어, E코어 이외에 듀얼코어(2코어)로 구성된 '저전력 아일랜드 E코어'를 내장했다. 이 세대에서는 저전력 아일랜드 E코어→E코어→P코어 순으로 작업을 배분했다.

■ 루나레이크, 대부분 작업에서 E코어 우선

반면 인텔이 올 3분기부터 공급할 루나레이크(Lunar Lake)는 P코어 '라이언코브'(Lion Cove) 4개, E코어 '스카이몬트'(Skymont) 4개 등 코어 2종류만 탑재한다.

루나레이크 CPU 타일은 P코어 4개, E코어 4개 등 총 8개로 구성됐다. (사진=지디넷코리아)

라즈쉬리 차북스와 펠로우는 "루나레이크에 포함된 스카이몬트 코어 4개는 IPC가 상당히 향상됐고 좋은 성능을 낸다. 이에 따라 스레드 디렉터도 전력 효율이 좋은 E코어에 모든 작업을 우선하도록 설계됐다"고 밝혔다.

예를 들어 PC 부팅이 끝난 대기상태에서 오피스 프로그램이나 웹브라우저를 실행할 때 처음에는 E코어를 활용한다. 그러나 많은 숫자를 피벗 테이블로 처리하는 엑셀 파일이나 복잡한 자바스크립트 실행시는 이를 모두 P코어로 옮기는 방식이다.

오피스 프로그램 실행시 스레드 디렉터 작업 배분 예시. (사진=지디넷코리아)

라즈쉬리 차북스와 펠로우는 "이런 작업은 모두 윈도 운영체제가 실행하는 것이며 스레드 디렉터는 어디까지나 필요한 정보만 제공한다. E코어에서 P코어로 실행 작업을 옮기는 데 필요한 지연 시간은 0.02초 미만"이라고 설명했다.

다만 이런 작동 방식은 제조사의 의도와 다를 수 있다. 게임용 노트북에서 게임을 실행할 때 E코어를 활용하면 초기 실행이 늦어질 수 있다. PC 제조사 역시 일정 부분 유연성을 부여할 수 있다.

■ 루나레이크, E코어만 작동시 P코어 완전히 끈다

루나레이크에 포함된 스레드 디렉터는 실행하는 작업의 의도를 보다 잘 파악할 수 있는 방향으로 개선됐다. 내장된 P/E코어를 효율성 중시 'E 영역', 고성능 중시 'P 영역', '무영역'(Zoneless)으로 나눠 격리 실행한다.

루나레이크는 내장된 P/E 코어를 용도에 맞게 분할해 쓸 수 있다. (사진=지디넷코리아)

예를 들어 E 영역에 있는 E코어 실행시 P코어는 대기 상태로 들어간다. 또 P 영역에 있는 P코어 작동시 E코어는 대기 상태로 전환돼 전력 효율을 극대화할 수 있다. 루나레이크는 모든 작업을 E 영역에서 실행하며 P코어는 모두 대기상태로 돌린다.

루나레이크 E코어 작동시 P코어는 대기 상태로 전환된다. (사진=지디넷코리아)

라즈쉬리 차북스와 펠로우는 "'무영역'은 인텔이 제공하는 기본값이 있지만 PC 제조사가 효율성과 성능 중 어떤 목표를 우선할 것인지에 따라 배치되는 코어가 달라진다"고 밝혔다.

■ 마이크로소프트 팀즈 구동시 전력 소모 35% 절감

메테오레이크는 부하가 조금만 높아져도 P코어로 모든 작업을 옮기도록 윈도 운영체제에 권고했다. 그러나 루나레이크 내장 스레드 디렉터는 작업 배분에 소프트웨어 특성까지 고려한다.

마이크로소프트 팀즈 가동시 루나레이크 작업 배분 사례. (사진=지디넷코리아)

라즈쉬리 차북스와 펠로우는 "웹사이트를 연 상태에서 화면을 위아래로 스크롤하면 CPU 점유율이 갑자기 높아질 수 있다. 돌발적인 상황이 아니라 일정 시간 이상 지속되는 작업이 발견될 경우 이를 운영체제에 알리고 코어 변경을 권고한다"고 설명했다.

이어 "동일한 루나레이크 프로세서에서 스레드 디렉터의 절전 관련 기능 비활성화/활성화시 마이크로소프트 팀즈 전력 소모를 보면 관련 기능을 활성화할 때 전력 소모가 35% 더 낮았다"고 소개했다.

■ "AI 작업시 CPU·GPU·NPU 사이 작업 배분도 고려중"

스레드 디렉터가 한 가지 더 고려하는 조건은 바로 PC 제조사가 선택한 사전 작동 모드다. 라즈쉬리 차북스와 펠로우는 "많은 제조사는 제품 설계 의도에 따라 P코어나 E코어 중 적절한 코어에 융통성을 부여하길 원했다"고 설명했다.

스레드 디렉터는 PC 제조사의 설계 의도도 일정 부분 고려한다. (사진=지디넷코리아)

이어 "PC 제조사는 탑재 배터리 용량이나 설계 의도, 용도에 따라 배터리 지속시간 중시나 성능 중시 등 총 7단계 중 하나를 선택할 수 있으며 스레드 디렉터는 코어 배분에도 이를 고려할 것"이라고 밝혔다.

관련기사

스레드 디렉터는 코어에 작업 배분시 실행되는 명령어 등 평가에 일정 부분 AI를 활용한다. 그러나 이는 인텔 내부에서 학습을 거쳐 설정한 것이며 실제 사용 패턴과 차이가 있을 수 있다.

라즈쉬리 차북스와 펠로우는 ”AI 작업에서 CPU·GPU·NPU 사이 작업 배분을 고려중”이라고 설명했다. (사진=지디넷코리아)

라즈쉬리 차북스와 펠로우는 "향후 스레드 디렉터는 머신러닝을 이용한 AI 기반 스케줄링이 가능할 것이다. 또 AI 작업 처리시 CPU를 넘어서 NPU(신경망처리장치)와 GPU 사이 작업 배분을 위해 내부 관계자와 논의하고 있다"고 덧붙였다.