오픈AI "명령어 입력하면 고화질 영상 완성"...AI모델 '소라' 공개

오픈AI가 간단한 프롬프트 명령어로 60초 분량의 고화질 영상을 제작할 수 있는 생성형 AI 서비스를 공개했다.

15일(현지시간) 테크크런치 등 외신에 따르면 오픈AI는 텍스트 투 비디오(Text To Video) 모델 '소라(Sora)'를 공개하고 테스트에 돌입했다고 밝혔다.

소라는 높은 수준의 영상품질과 사용자의 메시지를 준수하며 최대 1분 길이의 비디오를 제작할 수 있는 생성형 AI다.

프롬프트를 정확하게 해석하고 이를 영상으로 표현할 수 있도록 달리3에 적용된 시각 훈련 데이터를 적용해 언어에 대한 이해도를 높였다.

소라는 데이터 학습을 통해 여러 캐릭터, 특정 유형의 동작, 피사체와 배경의 정확한 세부 정보로 복잡한 장면을 생성할 수 있다. 또한 실제 세계에 대한 이해를 바탕으로 사용자가 요청한 내용 외에도 사실적인 표현을 위해 세부적인 요소들이 영상에 자연스럽게 추가된다.

다만 오픈AI는 아직 소라가 완전한 제품이 아니라고 밝혔다. 복잡한 장면의 물리 표현을 시뮬레이션하는 데 어려움을 겪을 수 있으며 특정 상황의 원인과 결과에 대해 완전히 표현하지 못할 가능성이 있다.

예를 들어 쿠키를 베어 물었을 때 쿠키에 물린 자국이 표현되지 못할 수 있다는 것이다. 왼쪽과 오른쪽 표현이 잘못 표현되는 등 공간적 세부사항이 혼동될 가능성도 있으며 잘못된 정보나 편견이 포함된 영상이 제작될 우려도 있다.

관련기사