손으로 쓴 200자가 폰트로...네이버 ‘손글씨체’ 기술 상용화 단계

네이버 개발자 컨퍼런스서 손글씨체 변환 기술 소개

인터넷입력 :2019/10/28 14:18

네이버 OCR(광학문자판독)팀이 개발한 손글씨체 변환 기술이 사용자가 200자만 글씨를 써도 가능한 상용화 수준에 접어든 것으로 나타났다. 이 기술은 내부 테스트와 이용자를 대상으로 한 대규모 공모전을 거치면서 상용화 단계까지 왔다.

네이버 OCR팀 이바도 개발자는 28일 서울 삼성동 코엑스에서 열린 네이버 개발자 컨퍼런스 ‘데뷰’ 세션 중 ‘나 대신 손글씨 써주는 AI 만들기’ 발표에서 OCR팀이 개발한 손글씨체 변환 기술에 대해 소개했다.

이 개발자는 “그간 OCR팀이 손글씨체 기술 개발에 착수해 어느 정도 성과를 거뒀고, 지난 7월11일 회사 기획팀에서 이 기술을 갖고 한글날 공모전을 열었으면 좋겠다고 했다”며 “그후 한글날까지 약 3개월간 급속도로 기술 개발을 이뤄 1만1천여개의 글자를 다 써야하는 게 아닌, 현재는 200자만 써도 손글씨체 변환이 가능한 수준까지 왔다”고 설명했다.

네이버 OCR팀 이바도 개발자가 28일 열린 네이버 개발자 행사 '데뷰'에서 손글씨체 변환 기술에 대해 소개하고 있다.

또 이 개발자는 발표 후 기자와 만난 자리에서 “우리 팀의 손글씨체 변환 기술은 세계적으로 앞선 편이다”며 “상용화가 가능한 기술은 아직 보지 못했다”고 덧붙였다.

손글씨체 변환 기술의 생성 파이프라인은 크게 ‘선행학습(Pretrain)’, ‘미세조정(Finetune)’, ‘생성(Generation)’ 3단계로 구성됐다. 그중 선행학습에 사용되는 데이터의 품질이 최종 생성물에 큰 영향을 끼쳤다.

폰트로 변환하기 위해 요구되는 손으로 쓴 글자의 수는 초성 19자, 중성 21자, 종성 28자를 곱한 만큼에, 영어와 기호 94자, 낱글자 51자를 합쳐 총1만1천317자다. 이는 200자 원고지에 띄어쓰기 없이 57장을 빼곡히 쓴 분량이다.

개발팀은 선행학습, 미세조정, 생성 각 과정에 사용되는 장치들을 바꿔가며 성능을 끌어올렸다.

손글씨체 변환 기술 중 선행과정의 성능을 개선한 방법.

개발팀은 ‘꽧, 쀓, 쌆, 컒, 퓲, 퉖’와 같은 평소에 사용되지 않는 글자를 제외하고, 쉬운 글자만 사용해도 상용화에는 큰 문제가 없을 것으로 판단했다. 애초에 선행학습에 쉬운 글자만 투입하면 각 과정마다 높은 수준의 처리 결과를 얻을 수 있었다.

또한 초·중·종성의 글자를 따로 인식할 수 있도록 해, 1만1천여 글자를 모두 판별해야 하는 번거로움을 줄이는데 기여했다. 그 결과 손글씨체를 만들기 위한 최소 글자 수를 200자까지 줄일 수 있었다.

손글씨 템프릿을 스캐너 기기로 스캔해야 하는 물리적 장벽도 허물었다. 스마트폰 카메라로 손글씨 템플릿을 촬영할 수 있도록 개선했으며, 이 경우 측면에서 찍거나 그림자가 진 채 촬영해도 문제가 없도록 했다.

관련기사

네이버 OCR팀은 손글씨체 변환 기술의 성능을 향상시키기 위해 20~30여개 GAN기술을 대입해봤다.

손글씨체 변환 기술의 성능과 사용성을 모두 끌어올린 끝에 네이버는 한글날 공모전을 무사히 개최할 수 있었다. 공모전 접수를 받은 지난 9월4일부터 24일까지 20여일간 2만5천여명의 지원자가 참여한 성과를 거뒀다.

이 개발자는 “손글씨체 변환 기술의 성능을 향상시키기 위해 쓸 수 있는 GAN(대립하는 두 이미지를 높고 새롭게 이미지 조합해나가는 방법)기술은 다 써본 것 같은데, 그 수로 치면 20~30개는 되는 것 같다”며 “향후 10글자만 써도 손 글씨로 만들 수 있도록 노력하겠다”고 강조했다.