구글이 자연어를 이해할 수 있는 신경망 프레임워크를 오픈소스로 공개했다.
자연어 이해는 인공지능 기술을 구현하는 첫 단추다. 구글은 자연어를 이해할 수 있는 파싱 기술을 오픈소스로 공개해 인공지능 생태계 육성에 나설 전망이다. 최근 인공지능 생태계 확대에 업체들의 관심이 높아지고 있는 가운데 구글의 행보가 주목된다.
12일(현지시간) 구글은 자연어를 이해할 수 있는 언어를 문법에 맞춰 분류해 의미를 찾아내는 파싱 기능의 ‘파시 맥파스페이스(Parsey McParseface)’ 플러그인을 추가해 업그레이드된 신경망 기반 자연어 처리 플랫폼 ‘신택스넷(SyntaxNet)’을 공개했다.
신택스넷은 구글 텐서플로우 생태계 전략의 일환이다. 텐서플로우는 구글 기계학습(머신러닝) 프로젝트 이름이기도 하다. 구글은 텐서플로우를 지난해 11월 오픈소스로 공개했다. 이날 공개한 파싱 모듈도 텐서플로우 내 신택스넷에 플러그인 형태로 제공한다. 구글은 신택스넷과 파시 맥파스페이스 기능을 강화하도록 모듈 기능을 훈련하는 데 필요한 코드도 함께 공개했다.
구글에 따르면 신택스넷은 구글나우 음성인식 기능 등 자연어를 이해하고 활용할 수 있는 시스템 기반도 제공한다. 신택스넷 플러그인 모듈인 파시맥파스페이스에는 구글의 문장 속 단어, 문법 구조의 기능을 이해하는 기계 학습 알고리즘도 내장했다.
관련기사
- 왓슨 인공지능 로봇 나오미 “한국어 공부하고 있어요”2016.05.13
- SK 인공지능 브랜드 ‘에이브릴’ 선보여2016.05.13
- IBM 인공지능 왓슨의 8번째 언어는 한국어2016.05.13
- SK주식회사 C&C-IBM, 인공지능 사업 협력2016.05.13
구글은 포스트에서 “사람이 사용하는 언어가 모호하다는 점이 파싱의 가장 어려운 점”이라며 “자연어 파서는 단어의 변형을 찾아 가장 정확한 의미를 파악할 수 있도록 한다”고 설명했다. 구글은 뉴스로 시험한 결과 파시 맥파스페이스가 94%의 정확도로 영어의 의미를 파악했다고 밝혔다.
구글 파싱 플러그인은 아쉽게도 영어만 지원한다. 한국어는 해당되지 않아 국내 적용은 어렵다. 영어권 내 자연어 이해 생태계를 확산하겠다는 구글의 전략으로 풀이된다.