쏘카, 국제 딥러닝 컨퍼런스 'ICLR 2023'서 연구성과 발표

적은 데이터셋 환경 내 효율적인 딥러닝 사례 소개

인터넷입력 :2023/05/02 10:44

쏘카가 국제 딥러닝 분야 컨퍼런스인 ‘ICLR 2023’ 워크숍에서 연구 성과를 발표한다.

쏘카는 5일 ICLR에서 운영하는 워크숍 PML4DC에 참석해 딥러닝 연구 논문을 발표한다고 2일 밝혔다. 쏘카는 데이터 리소스가 부족한 환경에서 효율적으로 데이터를 학습시킬 수 있는 사례를 소개한다.

우선, 쏘카 인공지능(AI) 팀은 ‘공개 의도 분류에 대한 보정 효과 분석’에 대한 논문을 알린다. 논문에서는 딥러닝 모델이 실제값과 예측값 차이를 계산하는 ‘크로스 엔트로피 손실’로 데이터를 학습할 경우 생기는 손실값에 보정을 추가하는 방법을 제안한다.

왼쪽부터 쏘카 AI팀 원혜진 매니저, 박경호 팀장, 김현수 매니저.

또 문장 분류 문제에서 기존 학습 데이터에 포함되지 않은 카테고리 문장이 주어진 상황에서 딥러닝 모델이 이를 별도 ‘OOD(out-of-distribution)’ 라벨로 분류하는 방법과 데이터셋이 적은 환경에서 문장 분류 문제를 효과적으로 풀어낸 수 있는 방법을 담았다.

두 번째 논문에선 ‘텍스트 데이터 증강을 위한 품사 대체와 특징 공간 보간’ 방안을 제안한다. 논문은 데이터가 충분하지 않아 효과적인 모델 학습이 어려운 상황에서 유의어로 교체와 특징 공간 보간을 동시에 적용한 데이터 증강 기법에 대해 소개한다.

관련기사

이 기법을 활용하면 데이터가 부족한 상황에서도, 문장 분류 문제를 뛰어난 성능으로 풀어낼 수 있다.

이번 논문에 참여한 쏘카 AI팀(박경호 팀장, 원혜진·김현수 매니저)은 “세계 최고 권위 학회에서 쏘카 딥러닝 연구 성과를 공유할 수 있는 좋은 기회”라며 “이번 연구를 발판 삼아 쏘카에서 발생할 수 있는 다양한 문제를 데이터와 기술을 활용해 해결하고 효율화할 수 있는 방안을 연구해나가겠다”고 말했다.