액션파워 "들리는 모든 언어 다 글로 바꾼다"

AI 음성인식 받아쓰기 서비스 '다글로’ 서비스

컴퓨팅입력 :2021/08/06 19:21    수정: 2021/08/09 13:29

코로나19로 재택근무와 온라인 수업 등 비대면 업무가 일상화되고 있다.

비대면 업무는 출퇴근 시간 등 불필요한 시간 낭비를 줄였지만, 달라진 업무공간 등으로 집중력이 저하되어 업무 효율이 감소할 수 있다는 단점도 지적되고 있다.

특히 화상회의, 온라인강의 등 영상과 음성 기반 활동 증가로 이를 텍스트로 전환하는 업무 부담이 증가하고 있다. 이러한 부담을 줄이고 업무 효율 향상을 위한 인공지능(AI) 기술을 도입하는 기업이 늘어나는 추세다.

액션파워 AI 음성 받아쓰기 서비스 '다글로'(이미지=다글로)

조홍식 액션파워 대표는 재택근무 및 원격수업의 효율 향상을 위해 AI 음성인식 받아쓰기 서비스 '다글로’를 도입하는 사례가 급증하고 있다고 5일 밝혔다.

다글로는 액션파워가 음성인식 엔진을 기반으로 개발한 AI 음성인식 받아쓰기 서비스다.

화상회의, 원격 수업을 비롯해 스마트폰을 이용한 녹음 등 다양한 분야에서 음성을 활용한 업무가 늘고 있다. 이를 분석하거나 실무에 적용하기 위해 문서화하는 업무 부담이 높다는 점에서 착안했다.

조 대표는 “한 시간 이상 녹음 내용을 글로 받아쓰려면 1.5배 이상의 시간이 소요되며 이를 처리하는 담당자의 업무 부하도 상당하다”라며 “다글로는 음성 내용의 절반 정도만에 작업을 완료하며, 사람의 업무 부담도 최소화할 수 있다”라고 설명했다.

버트(BERT), GPT 등 주요 AI 언어모델과 자체 개발한 자동음성인식 기술을 바탕으로 화상회의, 전화통화, 강연, 뉴스, 법률강의, 인터뷰 등 도메인별 특화엔진과 학습을 통해 영상의 특성이나 주제를 빠르게 파악하고 정확성을 높였다.

조홍식 대표는 “많은 업무가 비대면으로 이뤄지면서 음성과 영상 기반으로 내용이 오간다”라며 “음성과 영상은 빠르고 쉽게 메시지를 전당할 수 있지만 관리나 데이터화가 어려워 텍스트전환이 필수적”이라고 설명했다.

이어서 그는 “하지만 음성을 텍스트로 전환하는 과정은 많은 시간을 소모하고, 업무량도 적지 않아 이를 개선할 방법이 필요했다”며 “이를 AI가 대신 처리하면 불필요한 업무를 개선할 수 있다”고 말했다.

액션파워는 국내 시장에 맞춰 한국어 관련 정보를 집중적으로 학습시켜 해외 AI서비스에 비해 국내 환경에서 더욱 높은 정확성을 보인다.

액션파워에서 공개한 바에 따르면 뉴스 영상을 분석했을 때 구글은 약 7.3%의 오류율을 기록한 반면, 다글로는 약 1.6% 수준에 그쳤다.

다글로는 단순히 음성을 텍스트로 전환하는 것을 넘어 띄어쓰기, 맞춤법검사, 문장 부호 생성까지 지원하며, 문장 및 문단의 긍정, 부정 등의 감정지수 산출, 유사도 및 키워드 추출 등 음성을 기반으로 한 분석 기능까지 함께 제공한다.

더불어 화상회의, 인터뷰, 상담 등 다수가 참여해 말이 오가는 상황에서도 누가 말을 했는지 분리해 텍스트를 정리할 수 있는 화자분리 기술이 적용됐다.

관련기사

액션파워는 비대면 일상을 중심으로 확대되는 음성인식 시장 추세에 따라 다글로를 중심으로 사업을 확대할 계획이다. 이를 위해 블라블라이엔엠, 리틀송뮤직 등 음성 기반 콘텐츠 솔루션 기업과 협업을 진행 중이다.

액션파워 조흥식 CEO는 "연내에 음성을 비롯해 화상회의 전체 내용을 인식해 문서화하는 원스탑 서비스를 출시하려 한다”며 “앞으로 음성 인식 외에도 AI기술을 일상생활에 접목시켜 삶의 질 개선에 기여하고 싶다"라고 말했다.