포자랩스 "'AI 작곡가' 더 똑똑해져…AWS로 모델 훈련 속도 9배↑"

[인터뷰] 포자랩스 김선웅 최고기술책임자(CTO) "비용 최대 69% 절약"

컴퓨팅입력 :2025/05/19 16:29

"인공지능(AI) 기반 작곡 기술이 발전할 수록 AI 모델·데이터 규모가 커졌습니다. 이에 운영 비용이 증가하고 개발 속도가 느려지는 등 여러 이슈가 발생했습니다. 이런 문제를 해결하는 데 아마존웹서비스(AWS) 솔루션이 큰 도움이 됐습니다. 운영 비용을 줄이고 모델 훈련, 개발 환경을 획기적으로 개선해 줬기 때문입니다."

포자랩스 김선웅 최고기술책임자(CTO)는 최근 지디넷코리아를 만나 "작곡 자동화를 위한 AI 모델 훈련·데이터 관리 환경을 개선했다"며 "이 과정에서 AWS 솔루션 도움이 컸다"고 밝혔다.

포자랩스는 AI를 활용해 음원 만드는 플랫폼을 공급하고 있다. 사용자가 음원 콘셉트, 장르, 분위기 등 관련 키워드를 입력하면 AI가 이에 맞는 곡을 만들어주는 식이다. 스케치부터 미디(MIDI) 작성, 사운드 입히기, 믹싱, 마스터링까지 음악 제작 전 과정을 자동화한다.

포자랩스 김선웅 최고기술책임자(CTO).

김 CTO는 약 3년 동안 음원 데이터를 자체 수집했다고 설명했다. 그는 "전문 작곡가 약 10명으로 구성된 팀이 직접 음원 데이터를 생성했다"며 "각 음원에는 장르, 분위기, 템포, 사용 용도 등 구조화된 메타데이터를 구축했다"고 말했다.

그러면서 "이 데이터는 타인 저작물을 활용하지 않아 표절이나 저작권 침해로부터 자유롭다"며 "이를 통해 생성된 음원 역시 법적 리스크 없이 상업적으로 활용 가능하다"고 덧붙였다.

"AI 모델·데이터 방대...운영 비용·개발 속도 이슈 발생"

포자랩스는 온프레미스 기반으로 음원 데이터를 학습하고 서비스를 운영해 왔다. (사진=포자랩스)

그동안 포자랩스는 온프레미스 기반으로 음원 데이터를 학습하고 서비스를 운영해 왔다. 이에 음원 데이터와 인프라 복잡성이 커질수록 모델 학습 속도 저하와 데이터 관리 어려움을 겪었다. 

김 CTO는 "이를 해결하기 위해 내부적으로 분산 학습 환경을 구축했지만 큰 효과를 보지 못했다"며 "일반 네트워크에서 데이터를 주고받는 방식으로는 그래픽처리장치(GPU) 간 연결 속도가 병목 현상을 일으켜 분산 학습 장점을 살리지 못했다"고 설명했다.

인프라 복잡성은 개발 효율성에도 영향을 미쳤다. 프론트엔드 개발자들은 인프라 운영에 대한 전문 지식이 부족했고, AWS 외부 환경에서 개발이 이뤄지면서 내부 백엔드나 데브옵스 팀 지원을 원활히 받기 어려웠다는 설명이다. 

결과적으로 서버 내 버그 발생이나 설정 오류에 대한 대응이 늦어졌다. 본래 비즈니스 로직 개발에 집중하지 못하는 상황까지 겹쳤다. 

또 키워드 프롬프트 버전 관리와 보안 정책 적용이 수작업으로 진행된 탓에 거대언어모델(LLM) 활용 비효율성까지 덩달아 증가했다.

"세이지메이커·아마존 베드록으로 비용·보안 다 잡아"

포자랩스는 AWS의 '아마존 세이지메이커'와 '아마존 베드록' 도입을 통해 문제 해결에 나섰다. (사진=포자랩스)

김 CTO는 AWS의 '아마존 세이지메이커'와 '아마존 베드록' 도입을 통해 문제 해결에 나섰다고 밝혔다. 모델 개발부터 학습, 운영 비용 등 개발 전반에 걸쳐 전환점을 경험했다는 설명이다.

세이지메이커는 모델을 쉽게 구축·학습·배포할 수 있도록 지원하는 AWS의 통합 플랫폼이다. 개발자와 데이터 과학자가 효율적으로 모델을 개발하고 운영할 수 있게 돕는다. 아마존 베드록은 거대언어모델(LLM) 기반 애플리케이션을 빠르고 안전하게 개발·배포할 수 있도록 지원한다.

우선 포자랩스는 세이지메이커의 '트레이닝 플랜'을 활용해 고성능 GPU 인스턴스를 미리 예약 구매했다. 해당 플랜은 사용 기업이 GPU를 이용하기 전 일정 할당량을 선구매하는 시스템이다. 

김 CTO는 "이는 클라우드 자원을 필요할 때마다 즉시 사용하는 온디맨드(on-demand) 방식보다 훨씬 비용 효율적"이라며 "온디맨드 대비 최대 69%까지 비용을 줄일 수 있었다"고 강조했다.

포자랩스는 세이지메이커의 '하이퍼팟(HyperPod)'을 도입해 분산 학습 환경도 개선했다. 김 CTO는 "단 3일 만에 분산 학습 환경을 구축했다"며 "여러 대 컴퓨터를 동시에 연결해 AI를 훈련하는 '멀티노드 학습'까지 원활히 진행했다"고 강조했다. 이어 그는 "기존 온프레미스 환경보다 최대 9배 빠른 속도로 모델을 훈련 수 있었다"고 말했다.

김 CTO는 "세이지메이커는 네트워크 병목이나 GPU 간 연동 문제없이 효율적인 개발 환경을 제공한다"며 "이로 인해 모델 개발 속도는 빨라지고, 학습 결과물 품질도 한층 향상됐다"고 덧붙였다.

포자랩스는 아마존 베드록 도입 후, LLM 운영 핵심 과제였던 프롬프트 버전 관리와 보안 정책 적용에서도 개선을 이뤘다고 설명했다.

김 CTO는 "기존에는 AI에 프롬프트를 입력한 후 어떤 반응이 나오는지 직접 보고 일일이 기록해야 했다"며 "문장을 조금씩 바꿔가며 테스트할 경우에도 그에 따른 결과를 수기로 정리해야 했다"고 지적했다. 이어 그는 "실험을 정확하고 효율적으로 하기엔 어려움이 있었다"고 밝혔다.

현재 포자랩스는 아마존 베드록 도입 후 프롬프트의 변경 이력과 결과를 자동으로 기록하고 관리하고 있다. 또 테스트나 오류 발생 시 롤백(이전 상태 복원) 작업도 체계적이고 안정적으로 수행할 수 있었다는 설명이다.

김 CTO는 아마존 베드록으로 보안 정책을 간편하게 설정할 수 있다고 강조했다. 아마존 베드록 가드레일이 욕설이나 혐오 표현, 개인정보 등 민감 콘텐츠를 자동 필터링할 수 있게 돕는다는 이유에서다. 그는 "AWS 콘솔 환경에서 비개발자도 손쉽게 보안 설정을 다룰 수 있다"며 "서비스 전반의 AI 안전성과 운영 편의성이 크게 올랐다"고 덧붙였다.

"AI 에이전트, 맞춤형 음악 시대 앞당길 것"

포자랩스는 아마존 베드록 중심으로 AI 기반 작곡 기능을 확장할 계획이라고 밝혔다. (사진=구글 제미나이)

포자랩스는 아마존 베드록 중심으로 AI 기반 작곡 기능을 확장할 계획이라고 밝혔다. 

김 CTO는 "현재 키워드뿐 아니라 문장 단위 명령어로도 맞춤형 작곡을 할 수 있는 기능을 개발 중"이라며 "품질 향상을 위해 지속적인 테스트를 거치고 있다"고 말했다. 

그러면서 "자연어는 사람이 상상하기 어려운 창의적 결과물을 만들어낼 수 있다"며 "다양성과 유연성 측면에서 큰 장점을 갖고 있다"고 주장했다.

그는 AI 에이전트 시대에도 작곡 업무 자동화 기술이 더 발전할 것이라고 내다봤다. AI 에이전트가 단순히 장르나 분위기만을 고려해 음원을 생성하는 것이 아니라, 실제 사용될 환경에 맞춰 결과물을 제각각으로 만들 것이라는 설명이다. 

관련기사

김 CTO는 "같은 음악이어도 광고 버전과 카페용 버전 등 공간에 어울리는 구성과 흐름을 AI로 자유롭게 변형할 수 있는 시대가 올 것"이라고 예측했다. 

이어 그는 "AI 에이전트가 최적의 곡 구성을 자동으로 결정할 수 있을 것"이라며 "우리도 작곡가 생산성을 높이고 맞춤형 음악 제작 효율성을 극대화하는 데 큰 역할을 할 것"이라고 강조했다.