AI가 영상 만드는 시대 왔다…"컴퓨팅 파워·수익 모델 마련해야"

영상모델에 드는 개발 기간·데이터양, 언어모델보다 3배 더 필요

컴퓨팅입력 :2024/02/20 17:31    수정: 2024/02/21 08:47

오픈AI가 영상을 생성하는 인공지능(AI) 모델 '소라'를 공개한 가운데, AI 영상 생성 서비스 상용화에 대한 여러 전망이 나왔다. 국내 업계 관계자들은 영상을 생성할 때 드는 컴퓨팅 인프라 수급 문제부터 해결해야 한다고 주장했다. 모델 수익화 방안도 마련해야 하고, 데이터 학습 방식도 주요 고려사항으로 보고 있다.

오픈AI는 지난 15일 문자를 입력하면 고화질 영상을 생성하는 모델 소라를 홈페이지를 통해 공개했다. 현재 내부 개발팀을 비롯한 소수 영상 편집가, 아티스트, 기업인들에게 공급된 상태다. 사용자 피드백을 통해 기술을 검증한 후 서비스를 출시할 방침이다. 출시 일정은 미정이다.

"컴퓨팅 인프라 수요 감당해야…모델 수익화 방안도"

국내 전문가들은 영상모델을 통한 비즈니스가 활성화하려면 아직 멀었다고 입을 모았다. 우선 서비스 구동에 필요한 컴퓨팅 인프라 수급부터 해결해야 한다고 강조했다. AI 영상 생성 서비스의 상용화가 본격화하면 이를 구동하는 그래픽처리장치(GPU) 등 컴퓨팅 인프라 수요가 더 높아질 것으로 보인다는 이유에서다. 업계 관계자는 "언어모델보다 이미지·영상모델 구동에 더 많은 컴퓨팅 파워가 든다"고 했다. 

오픈AI는 지난 15일 문자를 입력하면 고화질 영상을 생성하는 모델 소라를 홈페이지를 통해 공개했다. (사진=오픈AI)

단순 GPU 확보를 넘어 영상 생성 서비스를 비용 효율적으로 운영하기 위한 기술 개발도 본격화할 전망이다. 네이버 관계자는 "AI 모델 압축과 경량화를 돕는 AI 칩 필요성이 더욱 커질 것"이라며 "네이버가 삼성전자와 손잡고 AI 반도체 솔루션을 공동 개발하고 있는 이유"라고 본지에 전했다.

영상모델을 통한 수익화 마련도 구체적이지 않다. 한 업계 관계자는 "오픈AI가 챗GPT를 운영하는 데 드는 컴퓨팅 인프라 비용만 하루 70만 달러(약 9억3천만원)"라며 "이보다 더 무거운 영상모델을 서비스하려면 몇 배 더 높은 운영 비용을 감당해야 할 것"이라고 설명했다. 단순히 API나 구독형으로 기업들에 제공하다간 적자가 불가피할 것이란 분석이다.

영상모델 소라가 만든 비디오. (사진=오픈AI)

현재 AI 기업들은 범용 LLM 개발·운영에 드는 비용을 줄이기 위해 소형언어모델(SLM)을 개발하는 추세다. 범용 LLM에 자사 데이터를 넣어 파인튜닝 하는 방식도 진행하고 있다. 전문가들은 영상 생성 모델에도 동일한 방식을 적용했다간 낭패라는 입장이다. 한국어 LLM을 보유한 한 기업 관계자는 "LLM과 달리 영상모델은 기술적으로 경량화하기 힘들다"며 "모델 경량화는 퀄리티 낮은 영상을 생성할 수 있다"고 지적했다.

영상모델, 언어모델보다 3배 많은 데이터 필요

영상모델의 훈련 데이터양도 중요하다는 지적도 있다. AI 모델이 영화, 광고 등 산업에서 활용 가능할 정도로 수준 높은 이미지를 생성하기 위해선 이미지 데이터를 대량으로 학습해야 해서다. 

다쏘시스템의 수칫 제인 솔리드웍스·3D익스피리언스 웍스 전략 및 비즈니스 개발 부사장.

3D 설계용 AI 모델을 개발 중인 다쏘시스템의 수칫 제인 솔리드웍스·3D익스피리언스 웍스 전략 및 비즈니스 개발 부사장은 "일반적으로 언어모델을 학습시키는 것보다 영상모델 학습시키는 데 3배 더 많은 데이터양과 시간이 걸린다"고 기자에 전한 바 있다. 

관련기사

이미지 데이터에 스며든 사실 왜곡, 혐오 콘텐츠, 편향 등도 제거 해야 한다. 생성 결과물이 비윤리적이거나 편향된 경우 논란을 피할 수 없기 때문이다. 이에 오픈AI는 이미지 데이터 문제 해소를 위한 안전 조치를 취할 예정이라고 홈페이지를 통해 밝힌 바 있다. 영상에 등장할 수 있는 왜곡, 혐오 등의 기술적인 제거를 목표로 뒀다. 

오픈AI는 "현재 사내 레드팀이 소라에 적대적 모델 테스트를 진행 중"이라며 "소라로 만든 영상을 분류할 수 있는 소프트웨어 도구도 개발하고 있다"고 설명했다.