‘스푼라디오’ 어쩐지 귀에 착 감기더라니..."이 사람들 덕분"

오디오 기술 담당 '최재성·김환석' 개발자를 만나다

인터넷입력 :2023/10/23 14:38    수정: 2023/10/23 14:39

유튜브·넷플릭스·디즈니플러스 등 화려한 영상 콘텐츠 전성시대에, 아날로그 감성이 묻어나는 서비스가 잔잔한 빛을 내고 있다. 바로 오디오 라이브 방송 플랫폼 '스푼라디오'다.

누구나 목소리로 소통할 수 있는 플랫폼을 목표로 2016년부터 서비스 중인 스푼라디오는 화려함보다는 담백하고 따뜻한 느낌으로 이용자들의 일상에 스며들고 있다. 출퇴근할 때, 외로이 집에 혼자 있을 때, 고된 하루를 보내고 집에 돌아왔을 때 스푼라디오는 '요즘 같지 않은' 즐거움과 위로를 준다. 내 기분과 상황, 또 관심사에 맞는 채널에 들어가면 디제이가 반갑게 인사하고 부담을 주지 않은 선에서 질문도 건넨다. 이런 것들이 최신 미디어 플랫폼들이 줄 수 없는 스푼라디오만의 독특한 매력 아닐까 싶다.

스푼라디오는 대부분의 소통이 목소리와 채팅으로 이뤄진다. 그러다보니 오디오 기술이 그 만큼 중요할 수밖에 없다. 디제이의 목소리가 청취자들에게 끊김없이, 그리고 깨끗하고 선명하게 전달돼야 하기 때문이다. 특히 여럿이서 함께 이야기 하는 '라이브콜' 방송의 경우는 더욱 안정성을 필요로 한다.

스푼라디오 오디오 개발팀의 최재성(Tom) 안드로이드 SDK 담당 개발자와, 김환석(Rony) 미디어 서버 담당 개발자

"달달한 목소리를 끊김없이 선명하게"

스푼라디오의 따뜻한 감성과 목소리를 누가, 어디에서, 어떤 기기로 듣든 안정적으로 전달될 수 있도록 보이지 않는 곳에서 불철주야 힘쓰고 있는 '스푸너' 두 사람을 만나봤다. 귀와 마음으로 느껴지는 기술 개발에 힘쓰는 스푼라디오 오디오 개발팀의 최재성(Tom) 안드로이드 SDK 담당 개발자와, 김환석(Rony) 미디어 서버 담당 개발자가 그 주인공이다.

먼저 최재성 개발자는 오디오 솔루션 업체 가우디오 랩에서 6년 정도 근무하다, 보다 다양한 서비스 경험을 위해 약 2년 전 스푼에 합류했다. 김환석 개발자는 비디오 인코딩 솔루션 개발사 티젠소프트에서 미디어 서버 개발 경험을 키운 뒤, 스푼으로 넘어와 2년 가까이 라이브 방송 서버 시스템이 안정적으로 유지되는 역할을 맡고 있다.

스푼 개발 조직 문화에 대해 김환석 개발자는 “오디오 엔지니어링팀 4명 모두 각자의 포지션과 기술 스택을 갖고 있다. 다양한 기술 스택을 바탕으로, 자유로운 분위기에서 두려움 없이 일하는 조직”이라며 “자신이 배운 것들을 공유해주는 걸 좋아한다. 각자의 전문성을 존중해주고, 각자 영역에서 독립적으로 일한다”고 설명했다.

스푼라디오

두 개발자에 따르면 스푼라디오 오디오 엔지니어링팀은 스푼만의 특별한 압축 알고리즘과 SRT, RTMP, WebRTC와 같은 프로토콜을 통한 스트리밍 기술로 어떤 네트워크 환경에서도 라이브 방송을 매끄럽고 안정적으로 송출할 수 있도록 지원한다. 이를 위해 복잡한 배경 소음 제거, 에코 캔슬링, 왜곡 보정 등의 기술을 통해 청취자들에게 CD 품질의 소리를 제공한다. 또 고급 음향 처리 기술을 활용한 다양한 목소리 효과(리버브·코러스·에코·헬륨·빌런·로봇)를 통해 부가적인 재미도 준다.

최재성 개발자는 “동영상은 초당 30프레임의 장면이 빠르게 지나가는데 30프레임 중 한두 개의 프레임이 빠져도 알아채기 힘들지만, 오디오는 1초당 4만8천 샘플 중 하나만 끊겨도 인지가 된다”면서 “고음질의 소리를 끊김 없이 압축해서 제공하는 것이 스푼의 기술력”이라고 말했다.

김환석 개발자는 “스푼 서비스 초창기 때는 다른 외부 솔루션을 사용했는데, 방송 중 시스템 불안정 이슈가 생겼을 때 외부 솔루션을 사용하면 이런 문제의 원인을 분석하는데 한계가 있을 수밖에 없다”며 “자체 서버를 만들고 나니 이슈 발생 시 접근성이 좋고, 새로운 기능을 추가하는 데에도 자유도가 높아졌다. 문제 해결 속도도 빨라졌다”고 밝혔다.

최대 8명 대화 가능한 '라이브 콜'...'에코 프로젝트' 통해 오디오 기술 공유도

나아가 스푼은 ‘라이브 콜’을 통해 여러 명의 발화자들이 동시다발적으로 얘기할 때 소리에 따라 위치를 변경시켜 누가 이야기를 하고 있는지 각각의 목소리를 구분할 수 있는 기능을 시범 제공 중이다. 다자간 콜은 디제이를 제외한, 게스트 최대 8명까지 목소리로 참여가 가능하다.

아울러 ‘스푼 라디오 에코’는 경량화하고 확장 가능한 방송 서버 개발을 목표로 오디오 엔지니어링 팀에서 진행 중인 오픈소스 프로젝트다. 스푼이 발전시킨 오디오 기술을 누구나 활용할 수 있도록 깃허브에 오픈소스로 공개하고 있다.

애플의 HLS(HTTP Live Streaming) 기술 기반으로, 저비용으로 CDN 네트워크를 통해 대규모 스트리밍 서비스가 가능해져서 디제이들이 낮은 지연 시간과 믿을 수 있는 오픈 소스 프로토콜을 통해 콘텐츠를 게시할 수 있는 환경을 제공하고 있다. 에코 프로젝트는 리눅스(Ubuntu, CentOS)와 맥에서 실행 가능하며, 서버의 빌드 및 실행, SRT 클라이언트의 테스트, SRT 및 RTMP 의 전송, HLS URL 의 테스트, HLS 스트림 출력 디렉토리 등을 주요 기능으로 제공한다.

오픈소스 공개에 대해 김환석 개발자는 “오디오 스트리밍 기술을 아무 배경 없이 구축하려면 관련 기술부터 습득해야 하고 이를 완전히 익히기까지 오랜 시간과 노력이 필요하다”며 “우리가 내재화된 소스를 공개함으로써 관련 기술 습득 및 구축 낭비를 줄여주고, 다양한 응용분야에서 활용될 수 있게 도움으로써 상호 피드백을 주고받으며 성장할 수 있다”고 자신했다.

"고객 목소리 더 귀 기울여 서비스 안정성 더 높이고파"

스푼 오디오 엔지니어링 팀은 디제이와 청취자들의 피드백을 자양분 삼아 성장하고 있다. “음질이 좋아졌다”, “서비스가 안정적이다”라는 의견에 힘을 받는다. 또 사용자들이 느끼는 불편이나 문제들은 가능한 신속하게 해결하고자 이용자들 의견에 귀 기울인다고. 나아가 앞으로 스푼라디오에 다양한 기능을 추가하고 서비스 안정성 더욱 높이고 싶다는 각오도 보였다.

관련기사

최재성 개발자는 “우선순위로 따지만 앞서진 않지만 최신 AI 기술을 도입해서 음성 텍스트 변환(STT), 음성 합성 기능 등을 추구해보고 싶은 개인적인 바람이 있다”고 말했다.

김환석 개발자는 “문제 상황이 발생했을 때를 대비해 모니터링 시스템이 구축돼 있는데, 이를 더욱 개선해 보고 싶다. 이용자들의 요구가 접수됐을 때 보다 빠르게 추적해서 불편함을 해소해 주고 싶다. 또 청취자가 1천명을 수용해도 될 만큼 서비스 안정성을 높일 계획”이라고 밝혔다.