행정문서 대부분이 인공지능(AI)이 읽지 못하는 형식에 묶여 있어 AI 정부 전환의 걸림돌이 되고 있다는 지적이 나왔다. 공공문서를 AI-레디(Ready) 포맷으로 전환하고 메타데이터·API 연계를 통해 호환성을 높여야 한다는 주장이다.

13일 위성곤 더불어민주당 의원실이 공개한 '공공분야 AI 활용 현황' 설문조사 결과에 따르면, 전국 행정기관 종사자 1만4천208명 중 91.1%가 보고서·계획서 등 행정문서를 주로 HWP(한글)나 이미지·스캔 PDF 등 AI가 인식하기 어려운 형식으로 작성하고 있다고 답했다. 기존 HWP, PDF 등의 파일 형태는 일반 텍스트가 아닌 이진법 형태인 바이너리 형태로 저장되는 특성으로 인해 기계가 직접 읽고 처리하기 어렵다.

이에 한컴에선 지난 2020년 정부의 행정 문서 데이터화 추진 계획을 시작으로 이듬해에 표준 형식을 'HWP' 파일에서 'HWPX'로 전환했다. 끝자리에 'X'가 새로 붙게 된 'HWPX'는 기존 'HWP'와 달리 개방형 XML 기반의 형식으로, 해당 포맷은 문서 내 콘텐츠를 기계가 판독하는 것이 가능하도록 설계된 것이 특징이다. 마이크로소프트 워드가 사용하는 'DOCX' 포맷과 데이터 추출에서도 큰 차이가 없다는 디지털플랫폼정부위원회 및 민간 전문위원회의 자문도 받았다.

행정안전부 또한 공공 데이터의 활용도를 높이기 위해 'AI-레디' 개념을 공공 데이터에 도입하고 세부 기준과 관리 체계 마련에 나섰다. 행안부는 AI가 학습, 분석, 추론 등에 쉽게 활용할 수 있도록 앞으로 공공 데이터는 AI가 바로 읽고 활용할 수 있는 형식으로 제공하고, 요약 통계와 갱신 주기, 변경 이력 등 풍부한 속성 정보를 메타데이터로 함께 담도록 할 예정이다.

(제작=코파일럿)

이와 별개로 지난 달 17일부터 이달 6일까지 중앙부처, 광역·기초자치단체 공무원을 대상으로 실시된 이번 조사에선 10명 중 7명이 실제 업무에 AI을 활용한 경험이 있는 것으로도 집계됐다. 전체 응답자의 68.9%는 챗GPT, 클로드, 코파일럿, 제미나이, 하이퍼클로바X 등 생성형 AI를 실제 업무에 활용한 경험이 있다고 답했다.

그러나 인터넷망 등 외부 개방망을 통한 사용 비율이 높아 정보 유출 우려도 제기됐다. AI를 사용하는 공무원 1만2천738명 중 인터넷망(개방형 망)에서 사용한다는 응답은 54.5%로 절반을 넘었다. 인터넷망과 업무망을 병행한다는 응답(12.9%)까지 포함하면 외부망 활용 비율은 67.5%에 달했다.

AI 활용 용도(복수응답)는 ▲자료 검색·정리(41.5%) ▲행정문서 작성·요약(30.8%)▲회의록·보고서 요약(14.1%) ▲녹취록 요약(5.6%) 순이었다.

AI 활용을 위한 교육 기반도 제대로 갖춰지지 않았다. 프롬프트 작성법 등 AI 도구 활용 역량을 위한 교육을 연 4회 이상 이수한다고 답한 공무원은 전체(1만4천208명)의 1.3%에 불과했고, 가끔 이수(연 1~3회)는 39.4%, 교육을 받은 적 없다는 응답은 59.4%에 달했다.

개인정보 보호·윤리·보안 등 가이드라인 관련 교육을 받은 경험이 있다는 응답도 39.6%에 그쳤다.

위 의원은 "폐쇄망 기반의 행정 전용 AI 환경을 마련해 보안을 강화해야 한다"며 "실무형 교육과 제도적 지원을 병행해야 한다"고 강조했다.