엔비디아, '플럭스닷원' RTX 최적화…AI 이미지 편집 속도 2배 '증가'

컨트롤넷 없이 자연어로 이미지 수정…VRAM 반으로 줄여도 실시간 편집

컴퓨팅입력 :2025/07/03 16:57

엔비디아가 복잡한 이미지 생성 과정을 단순화할 수 있는 인공지능(AI) 이미지 모델을 새롭게 공개했다. '텐서RT' 가속과 양자화를 적용해 RTX 그래픽처리장치(GPU)에서 신속한 생성과 편집이 가능해졌다.

엔비디아는 블랙 포레스트 랩스와 함께 '플럭스닷원 콘텍스트(FLUX.1 Kontext)' 모델을 RTX GPU에 맞춰 최적화했다고 3일 밝혔다. 현재 이 모델은 허깅페이스에서 무료로 배포 중이며 토치 버전은 '컴피UI'에서, '텐서RT' 버전은 로컬 환경에서 바로 사용할 수 있다.

기존엔 복잡한 마스크, 뎁스, 엣지 맵 없이 자연어만으로 고정밀 편집이 어려웠다. 이제 '플럭스닷원 콘텍스트'는 컨트롤넷 없이도 참조 이미지 기반으로 텍스트를 입력하면 세부 조정이 가능하다. 캐릭터 일관성 유지, 부분 편집, 스타일 전환 등 기능을 실시간으로 수행한다.

엔비디아가 복잡한 이미지 생성 과정을 단순화할 수 있는 인공지능(AI) 이미지 모델을 새롭게 공개했다. (사진=엔비디아)

엔비디아는 이 모델을 'RTX 40·50' 시리즈에 맞춰 FP8·FP4 양자화 버전으로 나눠 제공한다. FP8은 비디오 랜덤 액세스 메모리(VRAM) 사용량을 24기가바이트(GB)에서 12기가바이트로, FP4는 7GB까지 줄였다.

실행 성능도 크게 개선됐다. '텐서RT'는 '파이토치 BF16' 기반 모델보다 2배 빠른 추론을 제공하며 텐서 코어를 활용해 반복 작업 속도를 줄였다. 고급 사용자와 개발자용 샘플 코드도 곧 공개될 예정이다.

'플럭스닷원 콘텍스트'는 고급 AI 기술 없이도 3D 장면 초안이나 블루프린트 없이 자연스러운 편집을 가능하게 한다. 직관적인 유저 인터페이스(UI)로 참조 이미지를 불러온 뒤 텍스트만 입력하면 원하는 방식으로 이미지를 진화시킬 수 있다.

관련기사

현재 이 모델은 '컴피UI', 블랙 포레스트 랩스의 플레이그라운드에서 직접 테스트할 수 있다. 오는 8월에는 엔비디아 'NIM 마이크로서비스' 형태로도 제공될 예정이다.

엔비디아 측은 "'플럭스닷원 콘텍스트'는 자연어와 이미지 프롬프트를 결합한 차세대 편집 툴"이라며 "생태계 확장을 통해 로컬 기반 생성형 워크플로우를 본격 대중화할 것"이라고 밝혔다.