"AI 덕에 일거리 줄어드나 했더니"…공무원 업무 대체 '시기상조'

유럽 국가들 AI 응답 서비스 실험 중…AI 환각 때문에 100% 만족 '불가'

컴퓨팅입력 :2024/07/10 10:22    수정: 2024/07/10 16:20

#. 작년 프랑스로 유학을 다녀온 고현경(23·가명) 씨는 프랑스 특유의 '싸데뻥(Ça dépend, 그때 그때 다르다)' 행정에 치를 떨었다. 그는 1년 유학 과정 중 6개월 가까이 건강 보험, 트램 벌금 납부 등 행정 처리에 어려움을 겪었다. 고 씨는 전화, 메일, Q&A 등 다양한 방법을 이용해 행정 처리를 공무원들에게 물어봤으나 연결이 어려웠고 연락이 닿았다 하더라도 "기다리라"는 말 외엔 듣지 못했다고 말했다. 그는 "인공지능(AI) 등을 통해 예상 행정 처리 기간 등을 알 수 있었으면 좋았겠지만 행정이 복잡해 앞으로 가능할 진 모르겠다"고 아쉬움을 토로했다.

유럽을 중심으로 행정 질의응답에 AI 챗봇 도입 실험들이 진행되고 있지만 일부에서 여전히 미흡한 요소가 있는 것으로 분석됐다.

BBC 등 외신은 10일 영국, 포르투갈 등 일부 국가에서 AI 활용 정부 행정 서비스를 시범 운영 중이지만 이것이 아직까지 사람 공무원을 대체하기엔 어렵다고 지적했다.

프랑스의 한 지역 트램에 붙어있는 벌금 납부 및 안전 사항 지시문이다. 2개월 이상 미납 시 최대 180유로를 내야 할 수 있다고 안내하고 있지만 프랑스는 벌금 통지서가 서류로 오지 않으면 벌금 내역 확인에 오랜 시간이 걸린다. (사진=양정민 기자)

주된 이유는 AI 환각이다. AI 환각이란 AI가 실제론 없거나 사실이 아닌 정보를 그럴싸하게 꾸며 응답하는 현상이다. 외신은 AI의 응답이 100% 정확한 답변보단 자연스러운 응답을 선호하는 경향을 띄며 이를 위해 일부 응답을 꾸며낼 수 있다고 설명했다. 세금 납부, 복지 서비스 신청, 출생·사망 신고 등의 중요한 이슈에도 엉뚱한 답을 내놓을 수 있는 가능성이 있다.

일례로 영국이 챗GPT 기반 'GOV.UK 챗'의 초기 서비스 만족도는 70% 였다. 10번 중 3번은 잘못된 정보를 생성해 사실처럼 보여주거나 유용하지 못했다고 평가한 것이다. 영국 정부 디지털 서비스(GDS) 관계자는 "사실과 정확성이 중요한 행정 서비스에서 GOV.UK 챗은 우리가 원하는 최고 수준의 정확도에 미치지 못했다"며 "정확성과 신뢰성 문제를 해결하기 위해 이 실험을 계속해서 반복 중"이라고 밝혔다.

영국 정부 디지털 서비스(GDS)가 행정 처리 생성형AI 이용에 대한 가이드라인을 제시했다. (사진=GOV.UK 캡처)

포르투갈도 2023년 결혼, 이혼, 회사 설립 등에 이용할 수 있는 '정의 실무 지침서(Justice Practical Guide)'를 내놨다. 포르투갈 법무부 측은 이를 통해 약 2만8천여 개의 질의응답이 오갔지만 "18세 미만이지만 결혼한 경우 회사 설립이 가능한가"라는 고도의 법리적 해석이 필요한 질문엔 제대로 응답하지 못했다고 설명했다.

관련기사

에스토니아는 대규모 언어 모델(LLM)이 아닌 자연어처리(NLP) 알고리즘을 써서 챗봇을 운영 중이다. 외신들은 챗GPT에 비해 질문 늬앙스를 파악하는 능력은 부족하지만 틀린 내용을 말하거나 오해의 소지가 있는 답변을 내놓을 확률은 낮다고 내다봤다.

독일 뮌헨 루트비히 막시말리안 대학 스벤 니홀름 AI윤리학 교수는 "AI 챗봇은 자신이 하는 일에 대해 책임을 질 수 없다"며 "공공 행정에는 책임이 필요하고 이 역할은 아직까진 인간이 해야 한다"고 말했다.