개방형 AI 모델도 급이 있다…'오픈소스'와 '오픈웨이트' 차이는?

인공지능(AI) 기업들이 잇따라 개방형 AI 모델을 공개하는 가운데 '오픈소스'와 '오픈웨이트' 개념 구분이 모호해지면서 혼란이 커질 수 있다는 우려가 나왔다.

6일 IT 업계에 따르면 공개 범위나 활용 가능성에서 오픈소스와 오픈웨이트 모델은 큰 차이를 보임에도 개발사 사이에선 이를 모두 오픈소스로 홍보하고 있다는 지적이 나오고 있다.

우선 오픈소스는 모델의 구조를 비롯한 학습 코드, 데이터셋 정보, 파라미터 등 전 요소를 투명하게 공개하는 방식이다. 사용자는 모델 작동 원리를 분석하고 수정할 수 있다. 모델을 아예 처음부터 다시 학습시킬 수도 있다. 대표적인 오픈소스 모델은 프랑스 미스트랄AI의 '미스트랄', GPT-3의 오픈소스 버전 'GPT-J' 등이다.

'오픈소스'와 '오픈웨이트' 개념 구분이 모호해지면서 혼란이 커질 수 있다는 우려가 나왔다. (사진=구글 제미나이)

오픈웨이트는 말 그대로 학습 가중치만 외부에 제공하는 식이다. 제한적 공개 모델이라고 부르기도 한다. 공개 범위에 모델의 설계 코드나 학습 데이터는 포함되지 않는다. 사용자는 모델 파인튜닝이나 추론은 가능하지만 구조 변경이나 재학습을 할 수 없다. 메타의 '라마' 시리즈, 중국 제트에이아이(Z.ai)의 'GLM-4.5'는 모델이 대표적이다.

개방형 모델을 모두 오픈소스로 명칭할 경우 심각한 문제가 발생할 수 있다는 지적이 나오고 있다. 사용자가 오픈웨이트를 오픈소스로 오인하고 모델 구조 변경이나 재학습을 시도할 수 있어서다. 이럴 경우 코드와 데이터가 없어 프로젝트 전체가 중단될 수 있다. 파인튜닝만 가능한 오픈웨이트 모델 기반으로 개발을 기획하는 것은 일정·예산 낭비로 이어질 수 있다.

또 오픈웨이트 모델 중 다수는 상업적 이용을 제한하거나 별도 계약을 요구하는 라이선스를 포함한다. 이를 인지하지 못하고 상업 서비스에 통합할 경우, 라이선스 위반 소송이나 손해배상 문제가 발생할 수 있다.

AI 모델의 공공성, 책임성 평가에 있어서도 두 모델 차이는 크다. 업계 관계자는 "보통 오픈소스 모델은 학습 데이터와 알고리즘을 검토할 수 있어 편향성과 투명성 문제에 대한 검증이 가능하지만, 오픈웨이트 모델은 내부 구조가 불분명해 윤리적 책임소재를 따지기 어렵고, AI 거버넌스 기준을 충족하지 못할 수 있다"고 지적했다.

개방형 AI 모델도 급이 있다…'오픈소스'와 '오픈웨이트' 차이는?

관련기사

지금 뜨는 기사

이시각 헤드라인

'피지컬 AI' 원년…휴머노이드, 새해엔 현장서 뛴다

코너 몰린 쿠팡...과징금이냐 영업정지냐

AI에 진심인 韓, '피지컬 AI'로 글로벌 주도권 잡을까

AI 쫓던 통신, 해킹에 진땀...네트워크 본질로 집중

ZDNet Power Center