이미지 생성 인공지능(AI)의 스테이블 디퓨전의 최신버전이 공개됐다.
상황 인식 편집과 이미지 해상도를 높이는 등의 기능이 개선됐지만 지적재산권 보호를 위해 일부 예술가의 그림체와 성인용 콘텐츠 제작을 더 이상 지원하지 않는다.
영국 AI스타트업 스테빌리티 AI는 스테이블 디퓨전 2.0을 깃허브를 통해 공개한다고 공식 홈페이지를 통해 최근 밝혔다.
스테이블 디퓨전 2.0은 독일 비영리 AI단체 라이온(LAION)이 개발한 텍스트 인코더 오픈클립(OpenCLIP)으로 교육된 텍스트를 이미지로 변환하는 AI모델이 포함됐다. AI모델 추가로 512x512 픽셀과 768x768 픽셀 모두의 기본 해상도로 이미지를 생성할 수 있다.
해당 AI 모델은 성인용 콘텐츠를 제작하지 못하도록 차단하는 NSFW 필터에도 적용됐다.
또한 이미지 해상도를 4배 향상시키는 어퍼 스케일 디퓨전 모델도 추가됐다. 텍스트에서 이미지 변환 모델과 조합해 2048×2048 픽셀 또는 그 이상의 해상도의 이미지 생성이 가능해졌다.
이미지의 깊이를 추론해 텍스트와 깊이 정보를 사용하여 새 이미지를 생성할 수 있는 뎁스투이미지(depth2img)라는 신규 기능도 선보인다. 객체 정보를 일관성 있게 유지해 결과물이 자연스럽게 연결될 수 있도록 돕는다.
다만 그렉 루토스키 등 일부 예술가의 화풍의 이미지 생성은 더 이상 지원하지 않는다. 그렉 루토스키를 비롯한 예술가들은 사전 동의 없이 자신의 화풍을 AI에 교육시킨 후 이미지를 생성해 수익을 내는 등 권리를 침해하는 것을 비판한 바 있다.
스태빌리티 AI의 설립자 에마드 모스타크는 직접적으로 특정 예술가를 필터링 한 것이 아니라 데이터를 인코딩하고 검색하는 방식을 변경했다고 밝혔다.
관련기사
- 매스웍스, 2022 세종 AI 챌린지 후원2022.11.28
- 로마 정치인 키케로처럼...메타, 전략 짜고 협상하는 AI 개발2022.11.25
- 카페24, 에디봇 AI가 썸네일 이미지 알아서 편집해준다2022.10.06
- 의사과학자 양성 어떻게?...KAIST, 토론회 개최2022.11.28
그는 추후 예술가의 동의를 구하고 그림체를 추가하는 옵트인 교육 데이터 세트 등을 선보일 계획이라고 덧붙였다. 이 기능은 많은 아티스트가 요청한 사안으로 일부 비판을 완화하는 데 도움이 될 수 있을 것이란 전망이다.
반면 스테이블 디퓨전 2.0에서 직접 차단한 것은 성인용 콘텐츠다. 에마드 모스타크는 스테이블 디퓨전 2.0가 누구에게나 제공되는 개방형 콘텐츠인 만큼 성인용 콘텐츠는 제한될 필요가 있다고 강조했다.