중국 바이트댄스가 미국 오픈AI의 기술을 몰래 대규모언어모델(LLM) 개발에 사용했다는 보도에 반박했다. 바이트댄스는 글로벌 숏클립 앱 '틱톡(중국 서비스명 '더우인')', VR 헤드셋 브랜드 '피코', 뉴스 큐레이션 서비스 '투데이스헤드라인스' 등의 모기업이다.
17일 중국 언론 상하이정췐바오에 따르면 바이트댄스의 조디세스 대변인은 "GPT가 생성한 데이터는 '시드(Seed) 프로젝트' 개발 초기 단계에서 모델에 주석을 달기 위해 사용됐으며, 올해 중반쯤 바이트댄스의 훈련 데이터에서 삭제됐다"고 설명했다. 또 "오픈AI의 관련 서비스 사용시 규칙을 준수했고 현재 오픈AI와 소통하고 있으며 외부 보도로 인한 오해를 풀었다"고도 해명했다.
전일 미국 매체 더버지는 바이트댄스가 오픈AI의 기술을 자사 LLM 모델 개발 프로젝트인 시드 프로젝트에 사용해왔으며, 이는 오픈AI의 서비스 규칙을 위반한 것이라고 보도했다. 오픈AI는 이미 바이트댄스의 계정을 정지시켰다.
이 규칙은 오픈AI 서비스 약관 규정을 의미한다. 오픈AI가 제공하는 모델 기능을 '해당 제품 및 서비스와 경쟁하는 AI 모델을 개발하는데 사용할 수 없다'는 규정이다.
이에 대해 바이트댄스는 "올초 기술팀이 초거대 모델의 초기 탐색을 시작했을 때, 일부 엔지니어가 소형 모델에 대한 실험 프로젝트 연구에 GPT의 API 서비스를 적용했다"며 "이 모델은 테스트용이며 출시할 계획이 없고 외부에서 사용된 적이 없다"고 해명했다. 이어 4월 회사는 GPT API 사용 진단을 도입해 이를 중단시켰다.
이어 바이트댄스는 "올해 4월 초 바이트댄스의 초거대모델팀은 이미 내부에서 GPT 모델이 생성한 데이터를 바이트댄스의 모델 훈련 데이터세트에 추가하지 않도록 요구했다"고도 설명했다. 동시에 GPT의 서비스 규칙을 지키도록 교육시켰고 9월엔 또 다른 내부 검사를 진행해 API 규범 요구를 준수하는지 확인했다고도 덧붙였다.
더불어 바이트댄스는 마이크로소프트를 통해 GPT 애플리케이션프로그래밍인터페이스(API)를 사용할 수 있는 라이선스를 보유하고 있다고도 전했다.
단, 마이크로소프트 역시 오픈AI와 같은 규정을 적용하고 있다. 마이크로소프트의 프랭크쇼 대변인은 "애저 오픈AI 서비스 등 마이크로소프트의 AI 솔루션은 제한적인 액세스가 이뤄지는 프레임워크의 일부분"이라며 "이는 모든 고객이 필수적으로 마이크로소프트의 비준을 받아야 액세스할 수 있다는 것"이라고 전했다.
이에 바이트댄스가 오픈AI와 마이크로소프트의 서비스 약관을 위반하는 방식으로 API를 계속 사용하고 있었다는 게 오픈AI의 입장이다. 이 무렵 바이트댄스의 자체 초거대 AI 모델인 더우바오가 발표됐고, 이를 통해 시드 프로젝트가 시장에 출시된 것이라고 보고 있다.
관련기사
- 中 바이트댄스도 맞춤형 '챗봇' 생성 지원2023.12.05
- 바이트댄스 산하 VR업체 '피코' 23% 감원2023.11.13
- 中 화웨이·바이두·바이트댄스 등 'AI 보안 그룹' 결성2023.09.08
- 中 바이트댄스, 챗GPT '그레이스' 테스트 시작2023.08.07
이와 관련해 바이트댄스의 조디 세스 대변인은 "바이트댄스는 GPT를 사용해 중국 이외 시장을 위한 제품과 기능을 강화하지만 자체 개발한 모델은 더우바오 AI를 지원하게 위해 사용하며 더우바오는 중국에서만 출시됐다"고도 설명했다.
실제 바이트댄스는 올해 6월 '볼케이노 엔진'을 발표하고 이에 기반한 초거대 모델 '볼케이노아크'를 출시했다. 이어 8월 자체 개발한 '윈췌'가 중국 당국의 '생성형 인공지능 서비스 관리 방안'을 통과했다. 같은 달 AI 챗봇 상품인 '더우바오'가 외부 테스트를 시작했다. 더우바오는 챗봇, 글쓰기 비서, 영어 학습 비서 등 기능이 있으며 여러 질문에 대화 형식으로 답변할 수 있다.