PC AI 성능 측정 벤치마크 프로그램 '긱벤치 AI' 등장

윈도·맥OS와 x86·Arm 모두 지원... UL 프로시온 이어 두 번째

홈&모바일입력 :2024/08/25 11:53    수정: 2024/08/25 15:19

PC와 스마트폰 성능 비교에 가장 흔히 쓰이는 것이 바로 벤치마크 프로그램이다. 통제된 환경에서 서로 다른 회사(혹은 같은 회사) 프로세서나 제품 성능을 수치와 그래프로 가장 잘 비교할 수 있기 때문이다.

예를 들어 CPU 성능 비교에는 마이크로소프트 오피스 기반 자동화된 스크립트로 반응 시간을 측정하는 PC마크나 UL 프로시온을, GPU 성능 비교는 3D마크(3DMark)나 각종 게임에 내장된 벤치마크 모드를 활용할 수 있다.

프리미티브랩스가 개발한 PC AI 성능 비교 프로그램 '긱벤치 AI'.

그러나 지난 해 말부터 등장한 AI PC의 실제 처리 성능을 정확히 측정할 수 있는 소프트웨어는 없었다. 윈도 운영체제 탑재 PC 성능 비교용으로 널리 쓰이는 UL 프로시온 역시 AI 이미지 생성 벤치마크와 AI 컴퓨터 비전 벤치마크를 내장했지만 맥OS는 지원하지 않았다.

PC·스마트폰용 프로세서 성능 비교에 널리 쓰이는 '긱벤치'(Geekbench)를 만든 프리미티브랩스는 최근 AI 성능 측정용 벤치마크인 '긱벤치 AI 1.0'을 정식 출시했다. 인텔과 AMD 등 x86 기반 프로세서, 애플 M시리즈와 퀄컴 스냅드래곤 등 Arm 기반 PC에서 보다 폭 넓은 비교가 가능하다.

■ 주요 PC 프로세서, AI 성능 TOPS로 비교

AI 처리 성능에는 다양한 요소가 작용한다. 먼저 CPU 뿐만 아니라 NPU와 GPU가 함께 개입하는데다 FP32(부동소수점, 32비트), FP16(부동소수점, 16비트)나 INT8(정수, 8비트) 등 데이터 정밀도도 영향을 미친다.

INT8, BF16, FP16으로 생성한 이미지 정밀도 예시. (사진=지디넷코리아)

여기에 각 운영체제나 프로세서 제조사마다 지원하는 AI 처리용 라이브러리에도 차이가 있다.

인텔은 AI 실행을 위한 자체 라이브러리 '오픈비노'를 제공하며 마이크로소프트 윈도 운영체제는 ONNX 런타임을 지원한다. 애플은 M 시리즈 실리콘에 내장된 NPU를 활용할 수 있는 라이브러리인 코어ML을 이용한다.

TOPS 값은 주로 행렬 곱셈 등 연산 성능을 측정하기 위한 지표다. (사진=지디넷코리아)

지금까지 각 제조사는 NPU 성능을 비교하기 위한 요소로 TOPS(1초 당 1조 번 AI 연산)를 내세웠지만 이는 어디까지나 계산상으로 얻은 값이며 실제 성능을 정확히 반영하기 어렵다.

■ 긱벤치 AI, 폭넓은 운영체제·프로세서 지원

프리미티브랩스가 지난 14일 공개한 긱벤치 AI는 윈도11과 맥OS 등 다양한 운영체제는 물론 인텔, 퀄컴, 애플, AMD가 제공하는 최적화된 라이브러리를 모두 활용한다.

인텔 오픈비노, 마이크로소프트 ONNX, 애플 코어ML을 지원하며 지원 운영체제 역시 윈도와 맥OS로 확대했다. CPU와 NPU 별로 지원하는 라이브러리와 데이터 정밀도를 달리하며 작동 시간을 측정한다.

윈도 운영체제용 긱벤치 AI 실행 결과값. (사진=프리미티브랩스)

이를 활용하면 정밀도 별 CPU나 NPU 작동 특성, ONNX 런타임이나 코어ML 등 운영체제 제공 라이브러리 별 특성 비교에도 도움이 될 것으로 예상된다.

관련기사

■ 소비자와 업계에 TOPS 벗어난 실제 성능 제시 가능

긱벤치 AI 역시 한정된 시나리오에서 성능을 평가한다는 한계를 지녔다. 그러나 프로세서·GPU 제조사가 아닌 제3의 회사가 만든 중립적인 벤치마크 프로그램이 늘어났다는 데 의미가 있다.

인텔이 코어 울트라 시리즈2(루나레이크)를 오는 9월 3일 독일 베를린에서 출시한다. (사진=인텔)

오는 9월 인텔 코어 울트라 시리즈2(루나레이크)를 시작으로 이르면 내년 상반기 등장할 스냅드래곤 X 엘리트/플러스 2세대 등이 등장하는 시점에는 AI PC의 성능에 대한 보다 객관적인 비교가 가능해질 것으로 보인다.