멀티모달 AI '망각 현상' 외부저장법으로 해결했다…성능도 2배 개선

국내 연구진이 AI가 새로운 정보를 배우거나 기존 정보를 수정하면, 예전에 배운 지식까지 함께 잊어버리는 ‘치명적 망각' 문제를 원천적으로 해결했다. 지식 편집 성능도 2배이상 개선했다.

한국전자통신연구원(ETRI)은 임수종 언어지능연구실장 연구팀이 POSTECH(포항공대), 성균관대학교와 공동으로 ‘연속·복합 지식 편집 원천 기술(MemEIC)’을 개발했다고 24일 밝혔다.

AI 망각현상을 해결한 성진 ETRI 언어지능연구실 연구원이 기술 원리를 설명했다.(사진=ETRI)

이 기술은 지난해 미국 샌디에이고에서 열린 세계적인 인공지능 학술대회 '뉴립스(NeurIPS) 2025'에 채택, 공개됐다.

최근 챗GPT, 제미나이, 클로드 등 이미지와 텍스트를 동시에 이해하는 멀티모달 AI가 빠르게 확산되고 있다. 그러나 이들에는 맹점이 있다. AI가 새로운 정보를 배우거나 기존 정보를 수정하면, 예전에 배운 지식까지 함께 잊어버리는 ‘치명적 망각’ 현상이 발생한다.

특히 시각 정보와 언어 정보를 동시에 수정해야 하는 경우 두 종류의 지식이 서로 섞이면서 AI가 제대로 이해하지 못해 복합적인 질문에 틀린 답을 내놓는 경우가 빈번하게 나타났다.

연구팀이 이 같은 문제를 해결할 지식 편집 AI 기술을 공개했다. 이 기술은 새로운 정보를 AI 내부가 아닌 외부 메모리(보조기억장치)에 저장한다. 필요할 때만 정보를 불러와 사용하기 때문에 기존 모델 안정성을 유지하면서도 새로운 정보를 유연하게 추가할 수 있다.

기존 방식에서는 AI 내부의 핵심 파라미터를 직접 수정해 지식을 바꾸는 방식이 주로 사용됐다. 이로 인해 지식을 수정하는 과정에서 기존에 저장된 정보까지 영향을 받을 수 있다는 한계가 있었다.

논문 주저자인 성진 언어지능연구실 연구원은 "사람의 뇌가 좌우로 나뉘어 서로 다른 역할을 하듯 AI도 지식을 나누어 저장하도록 만든 것"이라고 말했다.

성진 연구원은 상용화 관련 "메믹이 기존 기술 대비 우수한 성능을 나타내지만, 실사용을 위해선 정확도가 90% 정도는 되어야 한다고 본다"며 "올해 말 기술이전이 이루어질 것으로 예상한다"고 덧붙였다.

이미지 관련 시각 정보는 ‘시각 어댑터’에 저장하고, 텍스트 관련 언어 정보는 ‘언어 어댑터’에 각각 독립적으로 저장한다. AI가 이미지와 텍스트를 함께 이해해야 하는 복합적인 질문을 받으면 ‘지식 커넥터’가 두 정보를 문맥에 맞게 연결해 답을 만든다.

연구진은 기술 성능 확인을 위해 1,278개 항목으로 구성된 복합 지식 편집 벤치마크(CCKEB)를 구축하고, 수백 건의 지식을 순차적으로 편집하는 실험을 진행했다. 그 결과 이 기술은 복합 질문 정확도가 70% 수준으로 나타냈다. 이는 기존 기술들이 36~52% 수준이었던 것과 비교하면 두 배 이상 향상된 성능이다.