래블업은 미국 콜로라도 덴버 컨벤션 센터에서 개최되는 “SC23”에 참가할 예정이라고 13일 밝혔다.
이 컨퍼런스는 고성능 컴퓨팅, 네트워킹, 스토리지 분석을 위한 행사로, AMD, ARM, AWS, IBM, 인텔, 엔비디아, SK하이닉스 등 국내외 기업이 다수 참여한다.
래블업은 이번 SC23에서 자사의 초거대 AI 생태계 구축을 위한 플랫폼인 백엔드닷AI를 소개한다.
백엔드닷AI는 엔비디아 CUDA, AMD ROCm 등의 GPU 지원뿐만 아니라, 다양한 NPU 및 AI 반도체들을 최적화 기능들과 함께 제공한다. 구글 TPU를 비롯해 그래프코어, 리벨리온 Atom 및 퓨리오사 워보이를 최적화 기능과 함께 지원하고 있다. 이를 통해 GPU로 AI 모델을 훈련하고, AI 반도체로 서비스를 연계하는 GPU-NPU 통합 파이프라인을 이용하여 최고의 성능과 최저 비용을 동시에 달성하고 있다.
백엔드닷AI는 GPU 다이렉트스토리지 기술을 컨테이너 클러스터에서 구현하여, GPU와 네트워크 스토리지를 직결함으로써 엄청난 데이터 입출력 속도를 제공한다. 이로써 고속 스토리지 시장의 퓨어스토리지, 넷앱, 델테크놀로지스 등과 파트너십을 맺었다. 더불어 아태지역에서 엔비디아 DGX레디 프로그램에 최초이자 유일하게 선정됐으며, VM웨어, 레드햇, 캐노니컬 등과 함께 엔비디아 AI 액셀러레이티드 프로그램의 파트너로 선정됐다.
관련기사
- 래블업 "20% 수준 GPU 효율, 90%로 끌어올린다"2023.10.30
- 래블업, IFA 2023서 LLM 서비스 해외 첫 공개2023.08.31
- 래블업, 거대 언어 모델 통합 개발 및 서비스 공개2023.08.16
- 래블업, ‘CES 2023’ 참가…AI 개발 플랫폼 새 버전 공개2023.01.02
이번 SC23에서는 백엔드닷AI가 이와 같은 기술을 활용하여 직접 개발 운영 가능한 LLM 서비스를 데모한다. IFA 2023에서 메타가 공개한 라마2 모델을 포함한 다양한 거대 공개 언어 모델을 다양한 응용 분야에 맞게 미세 조정하여, 백엔드닷AI의 자동화 시스템인 패스트트랙을 통해 온프레미스 환경에서 LLM 서비스를 개발하고 서비스할 수 있음을 알릴 예정이다. 사용자가 제공하는 사진을 기반으로 이야기를 만들고 이미지를 생성, 동화책을 만들어주는 멀티모달 데모인 비주테일(VisuTale)도 선보인다.
신정규 래블업 대표는 ”초고성능 AI에 더하여 다양한 슈퍼컴퓨터 솔루션들 및 고성능 컴퓨팅에 최적화된 백엔드닷AI를 전 세계 슈퍼 컴퓨팅 연구자들에게 소개할 수 있어 기쁘다“며 “앞으로도 막대한 양의 연산 자원이 들어가는 기술 선도 분야에서 백엔드닷AI를 통해 성능 및 비용의 혁신과 압도적인 편리함을 동시에 달성할 수 있도록 노력하겠다”고 밝혔다.