오픈AI "명령어 입력하면 고화질 영상 완성"...AI모델 '소라' 공개

학습 데이터 바탕으로 세부적인 요소까지 자연스럽게 구현

컴퓨팅입력 :2024/02/16 11:03    수정: 2024/02/16 14:59

오픈AI가 간단한 프롬프트 명령어로 60초 분량의 고화질 영상을 제작할 수 있는 생성형 AI 서비스를 공개했다.

15일(현지시간) 테크크런치 등 외신에 따르면 오픈AI는 텍스트 투 비디오(Text To Video) 모델 '소라(Sora)'를 공개하고 테스트에 돌입했다고 밝혔다.

소라는 높은 수준의 영상품질과 사용자의 메시지를 준수하며 최대 1분 길이의 비디오를 제작할 수 있는 생성형 AI다.

오픈AI에서 텍스트로 영상을 제작할 수 있는 생성형AI 소라를 공개했다(이미지=오픈AI)

프롬프트를 정확하게 해석하고 이를 영상으로 표현할 수 있도록 달리3에 적용된 시각 훈련 데이터를 적용해 언어에 대한 이해도를 높였다.

소라는 데이터 학습을 통해 여러 캐릭터, 특정 유형의 동작, 피사체와 배경의 정확한 세부 정보로 복잡한 장면을 생성할 수 있다. 또한 실제 세계에 대한 이해를 바탕으로 사용자가 요청한 내용 외에도 사실적인 표현을 위해 세부적인 요소들이 영상에 자연스럽게 추가된다.

다만 오픈AI는 아직 소라가 완전한 제품이 아니라고 밝혔다. 복잡한 장면의 물리 표현을 시뮬레이션하는 데 어려움을 겪을 수 있으며 특정 상황의 원인과 결과에 대해 완전히 표현하지 못할 가능성이 있다.

오픈AI에서 텍스트로 영상을 제작할 수 있는 생성형AI 소라를 공개했다(이미지=오픈AI)

예를 들어 쿠키를 베어 물었을 때 쿠키에 물린 자국이 표현되지 못할 수 있다는 것이다. 왼쪽과 오른쪽 표현이 잘못 표현되는 등 공간적 세부사항이 혼동될 가능성도 있으며 잘못된 정보나 편견이 포함된 영상이 제작될 우려도 있다.

관련기사

오픈AI 측은 “정식으로 소라를 사용하기에 앞서 안전하게 사용할 수 있도록 몇가지 중요한 안전조치를 취하려 한다”며 “편견, 혐오 관련 도메인 전문가인 레드팀과 협력해 모델을 적극적으로 테스트 할 것”이라고 밝혔다.

이어서 “우리는 AI가 창의적인 전문가에게 가장 도움이 되는 모델을 발전시키는 방법을 모색하고 있다”며 “이를 위해 다수의 시각 예술가, 디자이너 및 영화 제작자에게 액세스 권한을 부여하고 의견을 듣고 있다”고 설명했다.