"무하유는 12년 넘게 논문, 보고서, 자기소개서 표절 검출 서비스를 운영했습니다. 이젠 생성 인공지능(AI) 글 표절도 잡아내야 하는 시대입니다. 무하유는 올바른 생성 AI 사용 환경을 조성하기 위해 노력하겠습니다."
신동호 무하유 대표는 생성 AI로 작성된 글 표절을 방지하기 위한 서비스를 소개하면서 이같이 밝혔다.
무하유는 이달 초 'GPT킬러'를 개발했다고 밝혔다. GPT킬러는 오픈AI 챗GPT로 생성된 한국어 문장 표절 여부를 인식, 검출하는 서비스다. 사람이 챗GPT로 생성한 문장을 논문이나 보고서, 자기소개서에 표절한 경우를 잡아낸다.
한국어 챗GPT 표절 서비스는 국내에서 처음이다. 검출 정확도는 94% 이상이다. 무하유는 올해 9월 논문 표절 검사 서비스 '카피킬러'에 GPT킬러를 넣어 공급할 예정이다.
신동호 대표는 "GPT킬러는 문장 속 단어와 어순 관계를 추적해 맥락과 의미를 확률적으로 파악한다"며 "문장 사이 관계를 확률적으로 분석한다"고 설명했다. 이 관계가 확률적으로 맞아떨어지면, GPT킬러는 챗GPT 글로 인식한다. 이때 챗GPT 글로 추정하는 부분을 하이라이트 형식으로 보여준다. 반대로 관계가 확률적으로 낮을 경우, GPT킬러는 이를 사람 글로 받아들인다.
신 대표는 "GPT킬러의 표절 기준을 높게 설정해야 하는지, 낮게 정해야 하는지 고심하며 연구·개발했다"고 밝혔다. 표절 기준이 엄격할 경우, 표절하지 않은 부분까지 표절이라고 나올 수 있어서다. 표절 기준이 엄격하지 않으면 챗GPT로 인한 표절 사례를 놓칠 수 있다. 표절 여부가 논문이나 과제에 치명적인 만큼 이를 최대한 객관적인 근거 하에 판단해야 한다는 의미다.
신 대표 설명에 따르면 GPT킬러는 학계 표절 여부 기준과 동일하게 판단할 수 있다.
사람이 챗GPT 글에 나온 단어·문장을 어설프게 바꿀 경우, GPT킬러는 표절로 인식한다. 챗GPT 글을 사용자가 충분히 이해하고 문장과 단어를 자신만의 언어로 바꿨을 경우, GPT킬러는 표절로 보지 않는다.
"보통 사용자가 어설프게 챗GPT 글의 단어나 문장 순서를 바꾸면 티가 납니다. 사용자가 이해하지 않고 겉면만 어설프게 수정해서죠. 이는 실제로 명백한 표절입니다. 그러나 사람이 챗GPT 글을 충분히 이해하고, 이를 자기만의 언어로 활용하면 표절이라 볼 수 없습니다. GPT킬러는 이런 상황을 판단할 수 있습니다."
신동호 대표는 표절뿐 아니라 사실 여부까지 거르는 것도 중요하게 봤다. 사용자가 챗GPT 문장을 모두 이해하고 새로운 문장으로 쓸 경우, 표절보다는 팩트체크가 중요하다는 이유에서다.
그는 "사용자가 어떤 논문을 참고해서 문장을 수정했는지, 이 글이 정말 논문에 있는지 등을 확인해야 한다"고 설명했다. 신 대표는 "지금 GPT킬러는 표절 여부만 확인 가능하지만, 향후 팩트체크할 수 있는 기능까지 넣겠다"고 덧붙였다.
신동호 대표는 GPT킬러를 개발한 이유도 밝혔다. 인류가 생성 AI를 악용하지 않고 올바르게 잘 사용하도록 하기 위해서라고 했다. 챗GPT로 궁금한 정보를 얻을 수 있지만, 이를 부도덕한 방향으로 표절 등을 해선 안 된다는 의미다.
관련기사
- 무하유, 서울관광재단에 AI 서류평가 '프리즘' 공급2023.05.25
- 무하유, 사람인에 채용 서류 평가 솔루션 공급2023.04.12
- 무하유, 잡코리아에 '프리즘' 공급..."채용 서류 표절 걸러내"2023.03.22
- 무하유, ‘AI 면접’ 생활기록부도 참고한다2022.09.19
그는 이에 대한 첫걸음이 GPT킬러이길 바란다는 입장이다. 그는 "사람이 챗GPT로 더 많은 정보를 쉽게 접할 수 있는 시대가 왔다"며 "이를 지혜롭게 활용하는 것도 의무인 시대다"고 했다.
신 대표는 장기적으로 GPT킬러 적용 범위를 확장할 계획도 밝혔다. 그는 "논문을 비롯한 보고서, 자기소개서를 넘어 실험 보고서, 프로그래밍 코드 표절 여부까지 걸러내는 기능까지 개발하겠다"고 전했다.