기업용 애플리케이션의 상당수가 텍스트 외에도 이미지, 음성, 숫자를 함께 다루는 멀티모달 인공지능(AI) 기반으로 바뀔 전망이다.
4일 가트너 '등장 기술 임팩트 레이더 : 생성형 AI' 보고서에 따르면 오는 2030년까지 전체 기업용 소프트웨어와 애플리케이션의 80%가 멀티모달 형태로 전환될 예정이다. 이는 현재 기준 10% 미만에 불과한 수준에서 6배 이상 증가하는 수치다.
멀티모달 생성형 AI는 단일 모델에서 텍스트, 이미지, 음성, 숫자, 영상 등 다양한 입력과 출력을 동시에 다루는 기술이다. 이 기술은 기존 단일모드 시스템의 한계를 넘어서며 기업의 내부 시스템에서 실시간 판단과 능동적 작업 수행까지 가능하게 한다. 질의응답을 넘어 사용자의 다양한 맥락을 읽고 반응하는 '작동형 AI'로의 진화를 뜻한다.

가트너는 특히 의료, 금융, 제조 같은 도메인 중심 산업에서 멀티모달 AI가 신속히 확산될 것으로 봤다. 일례로 영상 기반 진단 이미지와 의료 차트를 동시에 분석하는 헬스케어 시스템, 실시간 음성 명령과 정량 지표를 결합한 금융 상담 시스템이 대표 사례로 꼽힌다.
더불어 보고서는 현재 대부분의 멀티모달 모델이 텍스트-영상, 음성-이미지 등 2~3개 모달을 조합하는 수준에 머물러 있다고 밝혔다. 다만 향후에는 입력 형태가 더욱 다양해지고 상호작용 방식도 정적 질의응답을 넘어 능동적 조치로 진화할 것이라고 봤다.
이에 가트너는 제품 관리자들이 이 같은 기술 변화에 즉각 대응할 것을 주문했다. 고도화된 멀티모달 모델은 단순 기능 확장을 넘어 고객의 실제 문제를 해결하고 기업이 제공할 수 있는 '가치 범위' 자체를 확장시킬 수 있다는 것이다.
관련기사
- 화웨이, 가트너® 매직 쿼드런트™ 백업 및 데이터 보호 플랫폼 부문 챌린저로 선정2025.07.01
- 오토메이션 애니웨어, 2025 가트너 매직 쿼드런트 로봇 프로세스 자동화 부문 리더로 선정2025.06.27
- 레노버, 가트너 공급망 선도 상위 25개 기업 선정2025.06.26
- 화웨이, 2025 가트너® 매직 쿼드런트™ 데이터 센터 스위칭 부문 리더로 선정2025.04.07
해당 보고서는 가트너 클라이언트를 대상으로 공개됐으며 별도로 멀티모달 AI의 상용 활용 사례를 다룬 스페셜 리포트도 무료로 배포되고 있다.
로베르타 코자 가트너 수석 디렉터 애널리스트는 "멀티모달 생성형 AI는 기업 운영방식 자체를 재편하는 기술"이라며 "조직은 다양한 데이터 입력을 유기적으로 활용해 사용자 경험과 효율을 극대화해야 한다"고 강조했다.