AI모델, 간단한 패치로 지식 전수…'분자비서'도 첫 공개

KAIST 국제학회서 논문 3편 발표…메모리 30% 절감하는 '탭플래시'도 공개

과학입력 :2026/01/27 10:03

스마트폰을 바꿀 때마다 연락처와 사진을 개인이 일일이 옯겨야 한다면 난감해진다. 실제 데이터 학습이 필요한 인공지능(AI) 모델에서도 이 같은 상황은 마찬가지였다. 새로운 AI 모델이 나놀 때마다 막대한 비용을 들여 데이터 학습을 다시했다.

국내 연구진이 이같은 문제를 해결할 대안으로 AI 모델 간 ‘지식 이식'이 가능한 기법을 제안했다. 향후 AI 모듈(SW) 패치로 지식 이식이 손쉬워질 전망이다.

KAIST가 개발한 트랜스미터. 모델 구조, 크기 등에 관계 없이 재사용 가능한 적응지식 전이 기법이다. 그림 왼쪽은 지식 최초 후학습 과정, 가운데는 지식 이식 과정, 오른쪽은 모델 강화 전개도다. (그림=KAIST)

KAIST는 전산학부 김현우 교수 연구팀이 고려대학교 연구팀과 공동으로 서로 다른 인공지능 모델 사이에서 학습된 지식을 효과적으로 ‘이식’할 수 있는 새로운 기술을 개발했다고 27일 밝혔다.

김현우 교수는 "이번 연구를 확장하면, 빠르게 발전하는 초거대언어모델이 등장할 때마다 반복적으로 수행해야 했던 후학습 비용을 크게 줄일 수 있다. 특정 분야 전문 지식을 손쉽게 추가하는 ‘모델 패치’가 가능해질 것”이라며 "지식 전수 과정에서 지적 재산권 침해나 윤리적인 문제는 없다"고 설명했다.

최근 인공지능 분야에서는 사진과 글을 함께 이해하는 시각–언어 모델(VLM)이 빠르게 발전하고 있다. 사용자가 사진을 보여주며 질문하면 설명을 해주는 챗GPT와 같은 멀티모달 AI가 대표적이다. 이러한 모델들은 대규모 이미지와 언어 데이터를 사전 학습해, 적은 양의 데이터만으로도 새로운 분야에 비교적 빠르게 적응할 수 있다는 장점을 지닌다.

그러나 새로운 AI 모델이 나올 때마다 이러한 ‘적응 과정’을 처음부터 다시 수행해야 한다는 점이 큰 비효율로 지적돼 왔다. 기존의 적응 기법들 역시 모델 구조가 조금만 달라져도 그대로 활용하기 어렵거나, 여러 모델을 동시에 사용해야 해 메모리와 연산 비용이 크게 증가하는 한계를 안고 있었다.

연구팀은 이러한 문제를 해결하기 위해 모델의 구조나 크기에 상관없이 학습된 지식을 재사용할 수 있는 전이 가능한 적응 기법인 ‘트랜스미터(TransMiter)’를 제안하고, AI가 쌓은 '적응경험'을 다른 AI모델로 쉽게 옮길 수 있다.

이는 AI의 복잡한 내부 구조를 뜯어고치지 않고, 예측 결과(output)만 보고 배운 요령을 다른 AI에게 전해주는 방식이다. 서로 생김새가 다른 AI 모델이라도 같은 질문에 내놓은 답변을 기준으로 정리해 주면, 한 AI가 익힌 노하우를 다른 AI도 바로 활용할 수 있다. 복잡하고 시간이 많이 드는 학습 과정을 다시 거칠 필요가 없고, 속도도 거의 느려지지 않는다.

트랜스미터 연구진. 왼쪽부터 KAIST 김현우 교수, 이상혁 박사후연구원, 송태훈 석사과정생, 고려대학교 박지환 박사과정생.(사진=KAIST)

김현우 교수는 "그동안 모델 구조나 크기가 다르면 재사용이 거의 불가능하다고 여겨졌던 AI의 적응 지식을 모델 종류에 상관없이 정밀하게 이식할 수 있음을 처음으로 입증했다"며 "필요한 분야에 맞춰 거대언어모델을 실시간 업데이트하는 이른바 ‘지식 패치(patch)’ 기술로의 활용도 기대된다"고 말했다.

연구는 KAIST 전산학부 송태훈 석사과정생, 이상혁 박사후연구원, 고려대학교 박지환 박사과정생이 공동 저자로 참여했다. 연구 결과는 인공지능 분야 국제 학술대회(AAAI 2026, Association for the Advancement of Artificial Intelligence)에서 구두로 발표됐다. 구두 발표 채택률은 4.6%다.

한편 김현우 교수 연구실은 이번 논문을 포함해 구글 클라우드 AI와 공동 진행한 문서 내의 테이블 이해를 고도화한 기술인 탭플래시(abFlash) 등 논문 3편을 이 학회에서 발표했다.

탭플래시는 정보 밀도가 높은 영역에 집중하고 중복된 정보를 최소화하는 전략을 통해 계산 효율성을 크게 향상시킨 기술이다.  점적으로 질문 내용을 인공신경망에 주입해 스스로 질문에 관련성 높은 입력 중심으로 정확하고 간결한 특성값 생성을 유도하는 기법이다. 기존 공개 모델 및 상용 모델을 모두 능가하는 성능을 달성했다.  연산량(FLOPs)은 7%, 메모리 사용량은 30% 절감을 실현했다.

다른 하나는 과학 도메인 인공지능 분자비서인 '콜라모(CoLLaMo) 시스템'을 개발했다. 분자구조를 1차원 문자열, 2차원 분자 그래프, 3차원 공간 정보로 통합 이해하고, 사용자 지시에 따라 분자 속성을 예측하며 다양한 질의응답과 분자 표현법 변환 등을 수행할 수 있다.

관련기사

KAIST가 생성형 AI모델을이용해 로봇 지식 전수 과정 이미지를 만들었다.(출처:KAIST)

김현우 교수는 이 콜라모가 인공지능 동료과학자(Co-scientist) 개념을 구현하고, 과학 연구 효율성과 발전속도를 획기적으로 높이는 데 기여할 수 있을 것으로 기대했다.

이들 연구는 국방기술진흥연구소 산학연 주관 핵심기술 연구개발사업과 정보통신기획평가원(IITP) 디지털혁신기술 국제공동연구사업 지원을 받아 수행됐다.