[현장] "GPU 대체 가능성 보인다"…딥엑스, '초저전력' AI칩으로 엔비디아에 도전장

'2025 국제인공지능대전'서 디바이스 내 추론 최적화 전략 공개…"5와트 이내로 LLM도"

컴퓨팅입력 :2025/05/15 17:21

딥엑스가 초저전력 인공지능(AI) 반도체 전략을 공개하며 그래픽처리장치(GPU) 중심의 시장 구도를 정면으로 겨냥했다.

김정욱 딥엑스 부사장은 15일 서울 강남구 코엑스에서 열린 '2025 국제인공지능대전' 세션에 참가해 자사 AI 반도체 전략을 발표했다. 이날 발표에서 김 부사장은 클라우드 추론의 한계를 지적하고 GPU의 시대가 가고 있다고 단언했다.

김 부사장에 따르면 딥엑스의 신경망처리장치(NPU)는 엔비디아 GPU 대비 60분의 1 수준의 전력으로 동급 이상의 추론 성능을 낼 수 있다. 그는 회사의 칩이 GPU보다 탑스(TOPS) 수치상으로는 낮아 보일 수 있지만 실제 유효 성능은 더 높다고 설명했다.

김정욱 딥엑스 부사장 (사진=조이환 기자)

그는 "GPU는 200탑스를 위해 40와트를 쓰지만 우리는 25탑스를 4.5와트로 구현한다"며 "연산량만 따질 게 아니라 실질적으로 몇 개의 프레임을 처리하느냐가 중요하다"고 강조했다. 이어 "'와트 당 탑스'가 아닌 '실효 처리량' 중심의 성능 평가 필요하다"고 강조했다.

또 김 부사장은 온디바이스 AI의 필요성을 7가지로 정리해 제시했다. ▲자율화 ▲무인화 ▲개인화 ▲연결 불안정 대응 ▲프라이버시 보호 ▲클라우드 비용 비효율 ▲탄소 배출 감축 등 기술적 필요부터 인프라·환경 이슈까지 아우르는 설명이다.

현재 딥엑스가 만든 AI 반도체는 실제 상용화 단계에 들어서 있다. 발표에서는 자율주행차, CCTV, 로봇 등에 실장된 실제 데모 영상이 이어졌다.

더불어 LG유플러스와 협업 중인 '스몰 LLM' 구동 사례도 소개됐다. 단말에서 일상적 질의응답을 처리하고 복잡한 연산만 클라우드에 넘기는 구조로, 속도·비용·보안 측면에서 모두 효율이 크다는 설명이다.

딥엑스는 이미 다양한 AI칩 라인업을 확보한 상태다. 김 부사장은 "우리는 성능은 높이고 발열은 사람 체온 수준인 35도 수준으로 유지한다"며 "팬리스 환경에서도 안정적으로 작동 가능한 것이 경쟁력"이라고 말했다. 이어 "이는 산업용 AI, 스마트시티, 군사 분야에도 곧바로 적용 가능하다는 점에서 실용성이 높다"고 설명했다.

관련기사

딥엑스는 초저전력 온디바이스 AI 반도체를 개발하는 팹리스 스타트업이다. 기술력과 상용화 가능성을 바탕으로 현재까지 340건 이상의 특허를 확보했으며 CES 혁신상과 대통령 표창 등을 수상했다. 협력 기업은 국내외 300곳이 넘고 현대차, 삼성, 포스코, LG전자 등이 주요 파트너로 참여하고 있다.

김정욱 딥엑스 부사장은 발표를 마치며 "AI가 향후 전기처럼 작동하고 공기처럼 존재하게 될 것"이라며 "그 중심에는 GPU가 아닌 NPU가 자리해야 한다"고 강조했다.