퓨어스토리지 "에이전틱 AI 성패, 'AI 레디 데이터'서 나온다"

[ACC 2025] 김영석 상무 "AI 학습 병목 증가"…'에버그린 원 포 AI' 소개

컴퓨팅입력 :2025/12/11 10:55    수정: 2025/12/11 12:50

"기업이 에이전틱 인공지능(AI)을 제대로 사용하려면 'AI 맞춤형 데이터'가 선행돼야 합니다. 무엇보다 이를 뒷받침할 고성능 스토리지가 필수입니다. 우리는 AI 훈련·추론·배포에 적합한 스토리지를 제공해 누구나 에이전트를 효과적으로 사용할 수 있는 환경을 제공합니다." 

퓨어스토리지코리아 김영석 상무는 11일 호텔신라 다이너스티홀에서 열린 'AI & 클라우드 컨퍼런스 2025(ACC 2025)'에서 AI 성능을 뒷받침하는 핵심 요소로 데이터 스토리지 중요성을 이같이 강조했다. 

김 상무는 AI 학습 지연 주요 원인으로 '스토리지 한계'를 꼽았다. 그는 "AI는 학습 과정에서 주기적으로 대규모 체크포인트를 저장해야 한다"며 "이때 저장 작업이 끝날 때까지 그래픽처리장치(GPU)가 대기 상태에 머물기 때문에 전체 학습 속도가 느려질 수 있다"고 지적했다.

퓨어스토리지코리아 김영석 상무.

김 상무는 메타데이터 작업 과정에서 병목 현상이 일어날 가능성도 언급했다. 그는 "실시간으로 메타데이터 작업이 수 백만 건씩 쏟아진다"며 "일반 스토리지는 이를 제때 처리하지 못해 데이터셋을 준비하는 데 긴 시간이 걸린다"고 주장했다. 이어 "스토리지 성능은 모델을 학습하거나 추론 단계로 넘어가기 전 한계에 부딪힐 수 있다"며 "전체 AI 프로젝트가 지연되는 구조가 발생한다"고 우려했다. 

그는 기존 S3 저장 방식이 AI에 적합하지 않다는 점도 지적했다. AI가 학습하거나 추론할 때 요구되는 빠르고 병렬적인 작업 속도를 제대로 S3가 감당하지 못한다는 이유에서다.

김 상무는 "기업은 S3에 저장된 데이터를 그대로 사용할 수도 없다"며 "이를 다시 파일 시스템으로 옮기는 추가 작업이 전체 처리 시간을 크게 늦춘다"고 설명했다.

그는 퓨어스토리지가 이같은 문제 해결을 위한 기술을 적용했다고 밝혔다. 우선 데이터 처리 지연 현상을 해결하기 위해 'S3 오버 RDMA' 기술을 스토리지에 추가했다. 이 기술은 저장된 데이터를 GPU로 바로 보내 데이터 지연을 없애는 것이 특징이다. 여기에 '래피드파일 툴킷'을 더해 데이터셋을 만들고 정리하는 시간도 크게 줄일 수 있다.

김 상무는 스토리지 관리가 복잡해지는 문제를 해결하기 위해 '제로무브 티어링' 방식도 제시했다.

김 상무는 스토리지 관리가 복잡해지는 문제를 해결하기 위해 '제로무브 티어링' 방식도 제시했다. 이 방식은 자주 쓰는 데이터와 오래된 데이터를 분리해 관리하는 기능이다. 데이터 이동이 필요 없어 운영 부담도 줄여준다. 또 여러 서버나 클라우드 환경에서 데이터를 쉽게 옮기고 안정적으로 유지할 수 있도록 '포트웍스' 기술도 갖췄다. 

김 상무는 AI 답변 속도를 높이기 위한 기술로 '키밸류 가속기'를 소개했다. 그는 "이를 적용하면 AI 추론 속도를 최대 20배까지 높일 수 있다"며 "GPU가 멈춰 있는 시간을 크게 줄일 수 있다"고 강조했다. 이 외에도 '퓨전'과 'AI 코파일럿'을 통해 장비 상태 확인을 비롯한 보안 점검, 성능 분석 등을 자연어로 쉽게 처리할 수 있다.

관련기사

김 상무는 기업의 투자 부담을 덜기 위한 구독형 서비스 '에버그린 원 포 AI'도 소개했다. 이 서비스는 AI 사용량에 맞춰 스토리지 성능을 조정할 수 있는 것이 특장점이다. 특히 수요 변화가 큰 기업이 비용을 안정적으로 관리하는 데 도움이 된다.

김 상무는 "기업은 AI 레디 데이터를 필수로 마련해야 한다"며 "정제된 데이터가 없다면 에이전트나 거대언어모델(LLM)을 제대로 활용할 수 없을 것"이라고 밝혔다.