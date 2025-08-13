ㅍ피지컬AI 선도기업 마음AI(대표 유태준)는 한국문화기술연구소와 공동으로 작성한 논문(주제: 'DESAMO: A Device for Elder-Friendly Smart Homes Powered by Embedded LLM with Audio Modality)이 HCI 분야 최고 수준 국제학회인 'UIST 2025(ACM Symposium on User Interface Software and Technology)' 포스터 트랙에 채택됐다고 11일 밝혔다.

회사는 "이번 연구는 On-device Large Audio Language Model(LALM) 기반의 기능적 데모가 학술적으로 발표된 세계 최초 사례로, 학계와 산업계 모두에서 주목받고 있다"고 설명했다. 'DESAMO'는 고령자의 일상 편의를 위한 음성 제어 기능과, 이상 상황 감지를 통한 안전 지원 기능을 결합한 스마트홈 특화 시스템으로, 실제 주거 환경에서의 적용 가능성을 극대화한 것이 특징이다.

최영원 마음AI 연구원이 논문 공동 제1저자에, 또 김화연 마음AI 연구원은 공저자로 참여했다. 연구는 과학기술정보통신부·정보통신산업진흥원의 ‘2025년 지능형 IoT 적용 확산 사업(과제명: 온디바이스 AI 기반 완전자율주행 SS기 개발 및 실증)’ 및 문화체육관광부·한국콘텐츠진흥원의 '2023년도 문화기술 연구개발 사업(과제명 : 시각장애인을 위한 개인 맞춤형 전시관람 컨시어지 서비스 기술 개발)'의 지원을 받아 이뤄졌다.

UIST 포스터 트랙은 최신 기술을 신속하게 공유하고 실용성을 논의하는 장으로, DESAMO는 향후 마음AI의 모든 온디바이스 LALM 기반 대화형 제품군의 핵심 기술로 적용될 예정이다.

피지컬AI 등 마음AI 제품들

한편, 마음AI의 또 다른 논문인 'Audio-Guided Visual Editing with Complex Multi-Modal Prompts'도 컴퓨터 비전 분야 최상위 국제 학회인 'BMVC 2025(British Machine Vision Conference)'에 정식 채택됐다. 이 연구는 사전 학습된 멀티모달 인코더를 기반으로, 오디오 인코더와 Stable Diffusion 텍스트 인코더 간 표현 공간을 효과적으로 정렬하는 zero-shot alignment 방법을 제안했다.

이를 통해 별도의 추가 학습 없이도 멀티모달 제어가 가능하며, 음성 기반 영상 편집 및 제어 기술에 폭넓게 적용할 수 있다고 회사는 밝혔다.

마음AI 김현유 연구원이 제1저자로 참여했다. 손병희 마음AI 연구소장은 “국제 학회 발표는 기술력을 글로벌 시장에 입증하고, 고객사와의 신뢰를 강화하는 중요한 계기”라며 “앞으로도 산업 현장에 즉시 적용 가능한 AI 기술 개발에 매진하겠다”고 밝혔다. 마음AI는 온디바이스 AI와 멀티모달 AI 기술의 연구·제품화를 병행하며, 향후 스마트홈, 의료, 산업 안전 등 다양한 분야로 기술을 확장, 적용할 계획이