[유미's 픽] 대만 지진에 韓 클라우드 기업 '한숨'…엔비디아 칩 구하기 '막막'

엔비디아 'H100' 생산 맡은 TSMC, 설비 복구 더뎌…칩 확보 차질 속 AI 인프라 경쟁력 향상 '하세월'

컴퓨팅입력 :2024/04/06 07:00    수정: 2024/04/07 12:12

대만 전역을 강타한 규모 7.4의 강진으로 데이터센터 구축 경쟁을 벌이고 있는 클라우드 기업들도 비상에 걸렸다. 인공지능(AI) 기술 발전으로 대규모 데이터 연산을 위한 고성능 그래픽처리장치(GPU) 확보가 중요해진 상황에서 이를 생산하고 있는 대만 TSMC가 생산 시설에 적잖은 피해를 입었기 때문이다.

6일 업계에 따르면 TSMC는 지난 4일 저녁 일부 라인의 자동화 생산 재개에 더 많은 시간이 필요할 것이라고 밝혔다. 

TSMC는 지난 3일 지진 여파로 생산 시설이 다소 피해를 입었고, 지진 발생 10시간 만에 공장 설비의 70% 이상을 복구했다. 극자외선(EUV) 리소그래피 장비 등 주요 장비에는 피해가 없으나, 일부 시설에서 소수의 장비가 손상된 것으로 알려졌다. 또 지진 발생 다음날인 4일 저녁부터 모든 공장의 가동이 재개될 것이라는 전망이 나왔지만, 5일에도 전체 공장 설비의 80% 정도만 복구된 것으로 전해졌다. 

TSMC 팹 (사진=TSMC)

이에 업계에선 일시적인 작업 중단으로도 천문학적인 손실이 발생할 수 있는 반도체 생산 공정의 특성상 이번 지진으로 TSMC의 피해가 상당할 것으로 봤다. 현재 추산된 피해 규모는 일부 웨이퍼가 손상된 것을 포함해 838억원 정도지만, 실제로는 더 1천억원을 훨씬 넘을 것으로 예상했다. 앞서 삼성전자는 지난 2021년 겨울 한파로 미국 텍사스주 오스틴 반도체 공장이 정전되면서 3천억~4천억원가량의 손실을 입었다. 이 공장은 6주 만에 정상 가동됐다.

투자은행 바클리는 "일부 첨단 반도체를 생산하려면 몇 주 동안 진공 상태에서 연중무휴 24시간 원활한 작동이 필요하다"며 "대만 북부 산업지역의 가동 중단은 생산 중인 일부 첨단 반도체가 손상될 수 있음을 의미할 수 있다"고 지적했다.

이 탓에 TSMC를 통해 초미세공정 칩셋 절대 다수를 생산해 왔던 엔비디아도 골머리를 앓고 있다. 최근 데이터센터들이 경쟁적으로 많이 사용하고 있는 H100 GPU 칩을 TSMC 4나노 공정으로 만들고 있어서다. TSMC의 지진 소식에 엔비디아에 대한 시장의 기대치도 낮아져 지난 5일 주가는 전날 대비 3.44%나 급락했다. AI 반도체 대장주로 불리던 엔비디아 주가(859.05달러)는 이날 종가 기준으로 지난달 11일 이후 가장 낮은 수준을 기록했다.

국가 AI 데이터센터 전산실(이미지=NHN클라우드)

이번 일로 'H100'을 앞세워 데이터센터 성능 경쟁에 나섰던 클라우드 업체들도 애태우고 있다. 지금도 'H100'은 고가에도 불구하고 줄을 서도 못 사는 제품인데 TSMC의 지진 여파로 수급 일정에 차질이 생길 가능성이 커졌기 때문이다. 

현재 클라우드 컴퓨팅 서비스를 제공하는 클라우드서비스제공사(CSP)들은 엔비디아의 고성능 GPU를 얼마나 확보했는지가 중요한 경쟁력이 됐다. 아마존웹서비스(AWS)와 마이크로소프트(MS), 구글클라우드 등 하이퍼스케일러(초대형 CSP)들은 H100 또는 그 이전 모델인 A100으로 수천~수만대 규모의 GPU 서버 팜(Farm)을 운용 중이다. 

국내 CSP들도 최근 H100 확보에 열을 올리고 있다. 일단 삼성클라우드플랫폼(SCP)을 서비스하는 삼성SDS는 1천 대 단위 H100을 확보한 것으로 알려졌다. NHN클라우드는 지난달 말 열린 기자간담회를 통해 아시아 최초로 H100을 자체 데이터센터에 1천 대 이상 확보했다고 밝힌 바 있다. 이는 국내 CSP 중 최대 규모다.

김동훈 NHN클라우드 대표는 "우리가 다른 벤더들보다 3배 더 갖고 있다고 알고 있다"며 "대형 통신사에서도 장비가 없어 우리한테 팔라고 연락이 올 정도"라고 말했다.

반면 네이버클라우드, KT클라우드는 아직 엔비디아 H100 이전 모델인 'A100'과 SK 사피온에서 만든 칩으로 데이터센터를 운용 중이다. 사피온은 SK텔레콤과 SK하이닉스, SK그룹의 투자 전문 회사인 SK스퀘어가 공동 투자한 AI 반도체 기업이다.

관련기사

업계 관계자는 "최근 엔비디아 H100을 얼마나 확보했는지가 시장에서 최대 화두가 되고 있다"며 "엔비디아의 주력 AI칩인 H100 GPU는 최대 4만 달러에 달하는 고가임에도 불구하고 최소 6개월~최장 1년을 기다려야 사용할 수 있는 상황"이라고 설명했다.

그러면서 "H100이 품귀 현상을 빚으면서 수급이 어려운 데 이번 대만 지진까지 겹치면서 IT 기업들의 칩 확보 경쟁은 앞으로 더 치열해질 듯 하다"며 "지난해 최소 45억 달러(약 5조8천억원)를 들여 H100을 15만 대가량 사들인 MS처럼 글로벌 빅테크들이 대규모 자금을 앞세우고 있는 상황에서 국내 기업들은 칩 확보 경쟁에서 더 힘들어질 듯 하다"고 덧붙였다.