NHN 언어처리팀이 영어 지문 하나로 여러가지 새로운 문제들을 재구성 하는 등 인공지능(AI)을 교육 분야에 접목한 연구 성과를 공개했다.
NHN 언어처리팀 남웅, 홍상원 개발자는 15일 NHN 개발자 행사 포워드에서 ‘자연어 처리 기술을 활용한 문제 생성 시스템’을 주제로 발표했다.
10월 교육부 발표에 따르면 향후 개인맞춤형 학습 플랫폼, 증강현실(AR)/가상현실(VR)을 활용한 학습 콘텐츠 개발 등으로 교육 분에야서도 AI를 가지고 여러 변화가 있을 것으로 전망된다. 이때 NHN은 학습자의 외국어 능력을 평가할 수 있는 솔루션을 개발하기 위해 자연어처리 기술 연구에 집중하고 있다.
홍 개발자는 "현재 개발중인 시스템에서는 하나의 지문 입력으로 간단한 독해 어휘 어법 등 다양한 문제를 생성할 수 있다"며 "수능 영어 외에도 중·고교 내신이나 초등영어수준의 쉬운 문제 생성해낼 수 있다"고 설명했다.
이어 "중간/기말고사를 준비하는 공교육 및 사교육 교사들이 변형 문제를 내거나 영어학습자가 다양한 문제를 풀 수 있는 시스템이 될 수 있도록 준비하는 단계"라고 덧붙였다.
이날 발표에 따르면 문제은행을 구축하기 위해서 대표적인 AI 기술인 자연어처리(NLP)가 핵심적이다. NLP 기술을 활용해 기계번역, 자동카테고리 분류, 형태소 분석, 지식사전 구축 등 작업을 진행할 수 있다.
이전까지 문제은행 구축 시스템은 자동화 수준에 머물렀다. 데이터베이스에 저장된 문제, 보기, 정답 등 구성요소들이 문제 호출시 각 유형에 따라 배치되는 방식이었다. 하지만 이 방식으로는 조합할 수 있는 문제 수가 제한적이다. 또한 품사를 구별해낼 수 없는 상태에서는 기존 패턴매칭 기법으로는 적절한 어휘 문제를 제작하는데 걸림돌이 된다.
그런데 이상적인 AI의 경우 복문의 문장 속에서 전체를 이끄는 주어와 동사를 구분할 수 있다. 또한 여러 가지 뜻 중에서도 문장에서 이용되는 뜻을 이해하고, 해당 어휘화 유의 관계로 묶이는 다른 단어들을 추리는 작업도 가능하다. 이에 따라 특정 어휘가 동사, 명사 등 어느 품사로 쓰였는지도 알 수 있어야 한다. 이는 형태소 분석 작업에 해당한다.
AI 기술 중 텍스트링크 기술은 지문 내 문장들 간 유의 관계를 살피며 같은 단어가 많이 사용될수록 유사도가 높다고 평가한다. 지문 내 어휘들을 종합적으로 분석할 경우 어휘 집합간 네트워크인 ‘워드넷’ 혹은 신셋으로도 구분된다. 워드넷 안에서 어휘 관계가 상하 관계인지 포함관계인지 구분할 수 있다. 가령 say의 유의어로 state, tell 등이 있음을 알려준다.
특히 어떤 단어를 밀집 벡터로 수치화 하는 과정을 거치는데, 이때 비슷한 값을 가지면 비슷한 어휘로 묶일 수 있다. 이는 워드 임베딩 과정에 속한다. 워드넷과 워드 임베딩 기술은 서로 조합돼 유사 어휘 문제를 만드는 데 사용된다.
홍 개발자는 “현재 나온 시스템은 어법, 어휘 문제 중에서도 쉬운 수준의 독해 문제만 낼 수 있다”며 “주제나 주장하는 바 찾기 등 문제유형을 낼 수 있을 정도로 폭넓은 독해 문제를 생성할 수 있길 바란다”고 말했다.
관련기사
- 개발자들의 생생한 현업 이야기 ‘NHN 포워드’ 개막2020.12.14
- NHN, 개발자 공채 필기시험에 ‘AI 감독관’ 투입2020.12.03
- NHN, AI 연구현황·실무경험 외부에 공개한다2020.12.02
- NHN, 클라우드 산업발전 유공 표창 수상2020.12.01
이어 “어휘 중립성 해소 작업을 진행하고 있지만 만족할 만한 수준은 아니며, 보다 나은 품질의 어휘 문제를 내기 위해서 딥러닝을 시도해볼 계획이다”면서 “자연어 처리를 활용해 텍스트를 요약하고 변형하는 기술을 활용하면 주제나 주장하는 바 찾기 문제도 낼 수 있을 거라 생각한다”고 덧붙였다.
또한 그는 “개인 맞춤형 교육 콘텐츠가 나와 학습의 질을 높일 수 있게 되면 좋겠다”며 “영어문제 생성시스템이 스스로 난이도를 자동 분류해 학습자 수준에 맞는 문제를 생성해낼 수 있길 바란다”고 강조했다.