네오와인 "PIM 실행 및 프로그래밍 모델 개발 추진"

[이효승 대표 인터뷰] "데이터 플로우 구조 기반...AI강국 위해 꼭 필요"

중기/스타트업입력 :2023/11/16 15:33    수정: 2023/11/16 15:36

"엔비디아는 CUDA 와 GPGPU를 동시에 보유하고 있어 LLM, GPT, CNN, RNN 등을 자유롭게 개발하고 관련 논문과 프로그램을 바탕으로 AI 개발 생태계를 조성하고 있습니다. 이런 생태계를 만들 때는 한분야만 잘해서는 안됩니다. NPU 하드웨어와 컴파일러 및 모델 변환과 개발 그리고 모델개발 및 데이터 프로세스까지 유기적으로 연결해야 판매가능한 반도체를 생산할 수 있습니다."

이효승 네오와인 대표는 16일 "AI산업은 NPU·GPU·컴파일러·모델·소프트웨어(SW)·데이터·서버·딥러닝이 유기적으로 결합한 산업"이라며 하드웨어와 소프트웨어간 연계와 생태계 중요성을 강조했다. 네오와인은 2002년 설립된 1세대 팹리스의 대표주자다. 복제방지 반도체와 보안반도체, AI반도체를 주사업으로 하고 있다.

특히 과학기술정보통신부(과기정통부)와 정보통신기획평가원(IITP)이 기획한 '데이터 플로우 구조 기반 PIM의 실행 및 프로그래밍 모델 개발' 과제를 한국전자기술연구원(KETI), 고려대학교, 연세대학교, 네오와인, 한국컴퓨팅산업협회, 티맥스티베로와 함께 수행하며 PIM 분야에서도 경쟁력을 쌓아가고 있다. 이 과제는 2022년 4월부터 2025년 12월말까지 진행된다. PIM은 Processing in Memory 의 약자로 메모리 내에서 AI 관련 연산처리가 가능한 반도체다. CPU까지 데이터를 가져오지 않아도 일부 데이터 처리가 가능한 차세대 반도체다.

네오와인 등이 수행하고 있는 과제는 PIM뿐 아니라 다양한 연산장치(CPU, NPU 등)를 복합적으로 활용해 인공지능 응용 프로그램을 효율적으로 동작시킬 수 있는 프로그래밍 모델을 개발하는 프로젝트다. 우리나라가 AI강국이 되려면 꼭 확보해야 할 원천기술이다. 한국 반도체는 메모리만 강국이다. 메모리의 대표 제품인 D램(DRAM) 시장점유율이 세계 시장의 70%, 낸드플래시는 46%로 세계 톱이다. 하지만 시스템 반도체는 사정이 다르다. 중소 팹리스 기준 1% 밖에 안된다. 반면 세계 시장규모는 메모리보다 시스템 반도체가 2.5배 더 크다.

이효승 네오와인 대표

이 대표는 "PIM(Process in memory)은 AI학습이나 추론 시 메모리 읽기/쓰기와 연산을 동시에 처리함으로써 메모리 효용 가치를 높인다. 메모리와 프로세서간 데이터 입출력 양을 줄이기 위해 고안된 방식"이라고 설명했다. 우리나라가 가진 메모리 분야 기술의 강점을 시스템 반도체 시장에 적용하려는 방법이라는 것이다.

데이터 센터에서 사용하는 전력량은 서버 데이터 처리 동작에 따라 막대한 열이 발생한다. 뿐만 아니라 이 열을 식히기 위해 사용하는 공조기의 전력량도 막대하다. "이 대표는 서버에서 사용하는 전력량의 32%를 CPU가 사용한다. 이외 나머지를 메모리와 관련 모듈이 사용한다"면서 "결국 PIM은 메모리 인터페이스 통신 데이터 양을 절감해서 에너지를 줄이려는 방안이기도 하다"고 짚었다.

그는 "PIM 연산을 위해서는 메모리를 제조하는 대기업 지원이 필수"라면서 "하지만 이보다 더 중요한 것은 '쿠다(CUDA, Computer Unified Device Architecture)'같은 컴파일러 기술 개발"이라고 소프트웨어와 생태계 조성을 역설했다. '쿠다'는 세계1위 AI칩 기업인 미국 엔비디아가 만든 GPGPU플랫폼이자 API모델이다. GPU의 가상 명령어셋을 사용할 수 있게 만들어주는 소프트웨어 레이어다. 엔비디아가 만든 CUDA 코어를 장착한 GPU에서 작동한다.

 현 컴퓨터의 근간인 '폰 노이만 구조'는 입출력 장치와 ALU를 기본으로 한 CPU 장치, 그리고 기억장치로 구분된다. 기억장치는 단기 기억장치인 D램(DRAM) 과 장기기억장치인 낸드플래시 메모리가 있다. AI등 서버에서 CPU 와 메모리간 통신 데이터 양이 증가함에 따라 2025년에는 세계 에너지 소비량의 3.2%를 데이터센터가 사용할 전망이다. 4년마다 데이터센터 소비 전력량이 두배가 될 것이라는 전망도 있고, 오는 2040년 세계 소비 전력량의 14%를 IDC에서 사용할 것이란 예측도 나와있다.

관련기사

네오와인은 NPU IP 설계에 자체 개발한 컴파일러를 사용하고 있다. PIM 연구 구현은 AI 모델 연산 워크로드를 다양한 연산장치에 얼마나 효율적으로 배분해 처리하는 지에 달려 있다. 네오와인은 IITP 주관 '데이터 플로우 구조 기반 PIM의 실행 및 프로그래밍 모델 개발' 과제에서 HW, SW, PIM, 컴파일러를 AI 모델에 적용하고 있다.

이 대표는 "AI 모델개발과 빅데이터로 학습한 모델을 런타임(Runtime)을 통해 응용프로그램을 실행하고 PIM 및 NPU 등의 연산장치와 유기적으로 연결해야 한다"면서 "네오와인은 IITP에서 수행중인 '데이터 플로우 구조 기반 PIM의 실행 및 프로그래밍 모델 개발' 과제를 통해 대학교와 출연연, 그리고 개발기업과 수요기업까지 아우르는 연합된 프로젝트를 통해 실제에 가까운 개발물을 만들어 가고 있다"고 밝혔다.