모레가 인공지능(AI) 시대의 경쟁력은 모델 아키텍처가 아닌 인프라 소프트웨어에 달렸다고 선언했다. 엔비디아의 대안 생태계를 위한 핵심 소프트웨어를 제공해 AI의 '개발 속도'와 '추론 비용' 전쟁을 주도하겠다는 것이다.

래블업은 24일 서울 양재 aT센터에서 'lab ¦ up > /conf/5'를 개최했다. 이날 조강원 모레 대표는 올해 초 시장을 뒤흔든 딥시크 사례를 통해 AI 경쟁의 본질이 어떻게 변하고 있는지 심도 있게 분석했다.

조 대표는 딥시크의 진짜 혁신은 모델 자체가 아니라고 단언했다. 그는 "딥시크가 공개하지 않은 진짜 비밀 병기는 경쟁사의 5분의 1 비용으로 서비스를 운영하는 '추론 소프트웨어'"라며 "AI 전쟁의 핵심이 비용 효율로 넘어왔다"고 말했다.

실제로 현재 AI 산업의 무게중심은 '달러 퍼 토큰' 즉 토큰당 비용을 줄이는 데 사활을 걸고 있다. 조 대표에 따르면 동일 퀄리티 모델의 서비스 비용은 매년 10분의 1씩 줄어들고 있으며 이 상황에서 기업간 치열한 최적화 경쟁이 벌어지는 중이다.

이같은 비용 전쟁의 '게임 체인저'로 '분산 추론' 기술이 부상했다. 조 대표는 "분산 추론을 잘하면 서버 100대로도 200배, 심지어 1천 배의 성능을 낼 수 있다"며 "이제 모든 데이터센터가 반드시 해야 하는 기술"이라고 강조했다.

모레는 이 분산 추론 문제를 해결하기 위해 '모아이(MoAI) 추론 프레임워크'를 개발하고 있다. 이 프레임워크는 수많은 분산 기법들을 자동으로 조합해 최적의 실행 계획을 수립하는 '자동화된 분산·라우팅 엔진'을 핵심으로 한다.

모아이 프레임워크의 궁극적인 지향점은 '이종 가속기'의 혼용이다. 연산 성능이 높은 AMD 그래픽 처리장치(GPU)와 메모리 대역폭이 강점인 다른 GPU를 섞어 쓰는 식으로 전체 비용 효율을 53% 개선한 사례를 직접 공개했다.

나아가 짐 켈러가 이끄는 텐스토렌트의 칩까지 조합해 소프트웨어를 통해 전체 인프라 효율을 극대화하는 솔루션을 개발 중이라고 밝혔다.

모레는 자회사 모티프를 통해 자체 파운데이션 모델도 직접 개발한다. 이는 구글이 텐서플로우처리장치(TPU)와 제미나이 모델을 함께 개발하며 시너지를 내는 것과 같은 전략으로, 미래 기술을 예측하고 자사 소프트웨어를 검증하기 위함이다.

조강원 대표는 "과거에 번들 소프트웨어로 취급받던 인프라 소프트웨어의 역할이 근본적으로 바뀌고 있다"며 "이제는 AI 모델의 성능과 비용을 좌우하는 가장 비판적인 요소가 됐고 우리는 그 영역의 최고가 될 것"이라고 강조했다.