'생성 AI 열풍' GPU 품귀에 국가 슈퍼컴 유탄 맞아

국가 플래그십 초고성능컴퓨팅 인프라 고도화 사업 일정 지연 우려

과학입력 :2023/08/18 15:44    수정: 2023/08/18 15:58

생성 AI 열풍에 따른 세계적 반도체 수급란에 국가 슈퍼컴퓨터 6호기 도입 작업이 유탄을 맞았다.

현재 한국과학기술정보연구원(KISTI)은 2024년 말 구축을 목표로 600페타플롭스급 성능의 슈퍼컴 6호기 도입을 진행 중이다. 이를 위한 2천 929억원 규모의 '국가 플래그십 초고성능컴퓨팅 인프라 고도화 사업'이 작년 8월 예비타당성 조사를 통과했다.

하지만 최근 KISTI가 발주한 슈퍼컴 구축 사업 입찰은 참여 기업이 없어 유찰됐다. 슈퍼컴 6호기는 AI 관련 연산 성능 향상을 위해 GPU 비중을 대폭 높였는데, 최근 챗GPT 등 생성 AI 열풍으로 엔비디아 GPU 반도체 가격이 급상승하면서 주요 슈퍼컴 기업들이 채산성을 맞추지 못해 입찰을 포기한 것으로 보인다.

슈퍼컴퓨터 5호기 누리온 (사진=KISTI)

이식 KISTI 국가슈퍼컴퓨터본부장은 18일 서울 광화문에서 열린 기자간담회에서 "HP(크레이)나 레노버 등 기업의 참여를 기대했지만, 입찰에 나선 기업이 없었다"라며 "성능 기준을 낮추지 않는 선에서 메모리나 스토리지 등 다른 부분의 비용을 줄여 최대한 기한 내 구축에 차질 없도록 할 것"이라고 말했다. KISTI는 이를 위한 신규 입찰 과정을 현재 진행 중이다.  

현재 AI 학습과 추론에 가장 널리 쓰이는 엔비디아 H100 GPU 모듈은 발주 후 물건을 받기까지 52주가 걸리는 상황이다. 엔비디아는 고가 정책을 고수하고 있기도 하다. 과거엔 관련 기업들이 정부 대형 프로젝트 납품이 갖는 상징성과 레퍼런스 등을 감안해 상대적으로 낮은 가격에 입찰했지만, 이번엔 전례 없는 GPU 품귀와 높은 가격으로 인해 참여 기업을 찾기 힘든 상황이 됐다. 이는 예타가 진행 중이던 2년 전에는 예상하지 못했던 상황이다.

이번 6호기는 기존 5호기 누리온에 비해 23배 빠른 600페타플롭스급으로 기획됐으며, 최근 AI 활용 증가에 발맞춰 GPU 위주 구조를 택했다. 성능의 98%는 GPU에서, 나머지 2%가 CPU에서 나온다. GPU 위주 구조를 택하면 CPU 중심 구조에 비해 전기료 부담을 절반 이상으로 줄일 수 있고, 속도로 높일 수 있기 때문이다. 슈퍼컴에서 많이 수행하는 소재나 나노, 바이오 분야 시뮬레이션이 이제 GPU 환경에서도 잘 돌아가게 된 상황을 반영했다.

다만 KISTI는 슈퍼컴 기업이 성능 기준만 만족시키면 되며, 특정 기업의 GPU를 꼭 써야 하는 것은 아니라고 밝혔다. AMD의 MI250 등도 성능은 떨어지지 않는 것으로 알려져 있다. 다만, 사용자 입장에선 생태계가 잘 갖춰진 엔비디아 제품을 쓰는 것이 편할 수 있다.

관련기사

현재 5호기 누리온은 평균 사용률이 75%에 이르는 등 과부하 상태이다. 5월 현재 누리온은세계 500대 슈퍼컴 순위에서 49위이다. 또 우리나라는 500대 슈퍼컴 순위에 들어있는 슈퍼컴퓨터 숫자 기준으로 세계 9위, 성능 총합에서 8위이다. 6호기는 기존과 같은 대학이나 연구소의 연구 지원뿐 아니라 사회적 현안 해결에 도움되는 연구에 대한 배분도 확대할 예정이다.

김재수 KISTI 원장은 "GPU 품귀에 환율마저 안 좋아서 어려운 상황"이라면서도 "슈퍼컴은 국가 전략 자원으로서 규모와 속도의 경쟁이 한창인만큼, 내년 말 가동을 목표로 최선을 다하겠다"라고 말했다.