IBM, 22배 빠른 AI칩 공개..엔비디아 넘을까

AI 전용칩 '노스폴', 폰 노이만 구조 극복해 발열·부하 해결

컴퓨팅입력 :2023/10/22 14:47    수정: 2023/10/25 11:04

IBM이 성능과 에너지효율 모두 22배 이상 향상시킨 인공지능(AI)전용칩을 공개해 AI 컴퓨팅 인프라 분야에서 엔비디아를 따라잡을 수 있을지 주목받고 있다. 

20일(현지시간) 실리콘앵글 등 외신에 따르면 IBM에서 개발한 AI전용칩 노스폴(NorthPole)의 벤치마크 결과가 과학학술지 사이언스에 실렸다.

공개된 자료에 따르면 노스폴은 합성곱 신경망(CNN) 레즈넷-50((ResNet-50)기반 벤치마크 환경에서 25배 더 높은 에너지 지표와 22배 더 짧은 대기 시간을 달성했다.

IBM의 AI전용 프로세서 '노스폴'(이미지=IBM)

IBM측은 “12나노미터(nm)로 개발된 노스폴이 더욱 고급기술인 4nm 방식으로 구현된 기존 GPU보다 수십 배 높은 성능과 에너지·공간 효율성을 갖는다”며 “새로운 칩셋은 기하급수적으로 인프라 투자 비용이 증가하는 AI시장을 바꿀 수 있는 잠재력을 가지고 있다”며 이번 프로세서의 의의를 강조했다.

북극이라는 뜻을 가진 노스폴은 캘리포니아에 위치한 IBM연구소에서 8년에 걸쳐 개발한 기계학습(ML)전용 칩셋이다.  뇌가 정보를 처리하는 신경망(Neural Networks) 기반 프로세서 트루노스 시스템의 후속작으로 총 220억 개의 트랜지스터로 구성된 256개 코어로 이뤄져 있다.

이 프로세서의 특징은 기존 CPU나 GPU에서 발생하던 폰 노이만 병목현상을 해결했다는 점이다.

폰 노이만 구조는 현재 사용 중인 컴퓨터의 기본 구조다. 주 기억 장치(메모리), 중앙처리장치, 입출력 장치로 이뤄진 디바이스에 프로그램을 내장해 모든 업무를 외부도움 없이 처리할 수 있도록 구성됐다. 이 구조가 적용되기 않은 애니악 등 초기 컴퓨터는 계산을 할 때마다 사람이 직접 회로를 조정해야 했다.

다만 이 방식은 모든 업무가 순차적으로 이뤄지는 구조로 최근 방대한 데이터와 복잡한 계산을 한번에 처리해야 하는 최근 IT서비스 환경에서 잦은 지연 등의 문제를 일으키고 있다. 계산을 위해 데이터를 저장하고 불러오는 과정에서 처리해야 할 프로세스가 과도하기 때문이다. 이를 폰 노이만 병목 현상이라고 한다.

IBM은 노스폴의 모든 메모리를 별도로 연결되지 않고 칩 자체에 포함시켜 데이터 전송시간을 최소화하며 폰 노이만 병목 현상을 해결했다고 밝혔다. 프로세서 내에 처리장치와 저장장치를 연결하는 네트워크를 구축하고, 가장 빠르게 업무를 처리할 수 있도록 코어와 메모리를 개별로 즉시 연결하는 구조다.

프로세서를 설계한 IBM의 두뇌 기반 컴퓨팅 부문 수석 과학자인 다멘드라 모드하 박사는 " 노스폴의 구조은 계산(컴퓨팅)과 메모리 사이의 경계가 모호하게 이뤄졌다”며 "개별 코어는 자동으로 계산에 적합한 메모리와 연결되며, 외부에서 보기에는 모든 입출력이 액티브 메모리로 처리되는 것으로 보인다”고 설명했다.

이어서 “새로운 노스폴의 설계구조는 기존 시스템에 쉽게 통합할 수 있으며, 동시에 컴퓨터의 부하를 대폭 줄일 수 있다”고 밝혔다.

IBM에서 공개한 기계학습 벤치마킹 결과(이미지=IBM)

이를 통해 벤치마크 결과에서 기존 CPU나 GPU에 비해 20배 이상 높은 성능과 에너지 효율성을 기록했다. 또한 적은 부하로 인해 발열이 적어 대규모 냉각시스템 없이 팬과 방열판으로 충분한 성능을 유지할 수 있어 좁은 공간에서도 효율적으로 활용할 수 있는 것으로 나타났다.

다만 IBM은 노스폴의 상용화를 위해 아직 해결해야 할 부분이 있다고 밝혔다. 구조상 프로세서에 메모리를 내장해 속도를 향상시킨 만큼 외부 데이터에 접근해야 하는 경우 노스폴의 장점이 약화될 수 있다는 것이다.

이를 해결하기 위해 하위 메모리 네트워크를 추가하는 방안을 연구 중이다. 대규모 신경망을 노스폴의 모델 메모리에 맞춰 분할한 후 이를 하위 네트워크로 연결하는 방식으로 현재 실제 서비스 등에 적용 후 테스트 중이다.

관련기사

다멘드라 모드하 박사는 노스폴을 기업용 인프라로 제공할 것이라고 밝히며 이를 활용해 자체적으로 새로운 AI서비스를 만드는 것은 고려하고 있지 않다고 설명했다. 더불어 자율 주행 차량부터 로봇 공학, 디지털 보조 장치, 증강현실(AR) 관련 전문 기업의 서비스를 혁신할 수 있을 것이라고 덧붙였다.

IBM은 새롭게 개발한 설계 구조를 활용해 더욱 집적된 프로세스를 개발하기 위한 연구를 진행 중이라고 밝혔다. 현재 3nm 기반 프로세서를 개발 중이며 수년 전부터 2nm 프로세서 관련 연구도 실시하고 있다고 설명했다.