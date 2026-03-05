회의 중 떠오른 아이디어를 메모하려다 놓친 경험이 있는가? 복잡한 생각을 정리하려고 키보드 앞에 앉았지만 막상 어디서부터 써야 할지 막막했던 적은? 홍콩시립대학교 연구팀이 개발한 '오럴리티(Orality)'는 이런 고민을 해결하는 새로운 방식의 AI 도구다. 사용자가 말로 생각을 쏟아내기만 하면, AI가 자동으로 핵심 내용을 추출해 연결 구조를 시각화하고, 심지어 사고의 모순까지 찾아낸다. 2026년 CHI 컨퍼런스에 발표될 이 연구는 12명의 참가자를 대상으로 한 실험에서 기존 챗GPT 음성 대화보다 생각 정리에 더 효과적이라는 결과를 입증했다.

생각을 말로 꺼내는 순간, AI가 지도로 그려낸다

오럴리티의 핵심은 '음성을 통한 생각의 외부화'다. 연구팀은 사람들이 생각을 정리할 때 머릿속에만 담아두는 것보다 밖으로 꺼내는 것이 훨씬 효과적이라는 확장 인지 이론(Extended Cognition)에 주목했다. 이 이론에 따르면 스케치, 메모, 다이어그램 같은 외부 도구는 우리 인지 과정의 일부가 된다.

음성은 특히 강력한 외부화 수단이다. 타이핑이나 그림 그리기보다 훨씬 빠르고 자연스럽게 머릿속 생각을 쏟아낼 수 있기 때문이다. 심리학 연구에서도 '소리 내어 생각하기(Think-Aloud)' 방법이 문제 해결 능력을 향상시킨다는 사실이 오래전부터 입증됐다. 하지만 문제가 있었다. 말로 표현한 내용은 선형적이고 비구조적이어서 나중에 다시 보고 정리하기 어렵다는 점이다.

오럴리티는 이 문제를 대형 언어 모델(LLM)을 활용해 해결했다. 사용자가 음성 입력 위젯을 통해 생각을 말하면, 시스템은 음성을 텍스트로 변환한 뒤 의미 분석을 수행한다. 그리고 핵심 정보를 추출해 노드(점)와 링크(선)로 이루어진 다이어그램을 캔버스에 자동으로 그려낸다. 마치 복잡하게 얽힌 실타래를 AI가 대신 풀어주는 셈이다.

Figure 2.Our conceptual FRAMEwork for self thought clarification process

단순 녹음이 아니라 '생각의 구조'를 보여주는 캔버스

기존 음성 인식 도구들과 오럴리티의 가장 큰 차이는 '구조화'에 있다. 오터닷에이아이(Otter.ai)나 줌(Zoom) 같은 도구들도 음성을 텍스트로 변환하고 요약을 제공한다. 하지만 이들은 여전히 선형적인 텍스트 형태로 결과를 보여준다. 연구팀의 사전 조사(Formative Study)에서 참가자들은 이런 선형 구조가 비선형적으로 흐르는 자신의 사고방식과 맞지 않는다고 지적했다.

오럴리티는 이 문제를 '의미적 캔버스(Semantic Canvas)'로 해결한다. 사용자가 말한 내용은 단순히 위에서 아래로 나열되지 않는다. 대신 주제별로 묶이고, 관련된 개념들끼리 선으로 연결되며, 공간적으로 배치된다. 사용자는 이 노드들을 마우스로 드래그해 위치를 바꾸거나, 음성 명령으로 "비슷한 주제끼리 다시 묶어줘"라고 요청할 수 있다. 마치 화이트보드에 포스트잇을 붙이고 옮기며 생각을 정리하는 것과 비슷하지만, AI가 자동으로 내용을 분류하고 연결해준다는 점이 다르다.

이 시스템은 피롤리와 카드(Pirolli and Card)의 센스메이킹(Sensemaking) 모델을 개인의 사고 정리 맥락에 맞게 재구성한 4단계 프레임워크를 기반으로 설계됐다. 첫 번째 단계는 '생각 외부화 계층'으로 음성 입력을 지원한다. 두 번째는 '구조화 및 도식화 계층'으로 노드 기반 데이터 표현을 제공한다. 세 번째는 'AI 기반 심화 계층'으로 사고의 공백과 모순을 찾아낸다. 마지막은 '성찰 및 발표 계층'으로 최종 결과물을 정리하고 내보낼 수 있게 한다.

AI가 던지는 질문이 생각의 깊이를 더한다

오럴리티의 또 다른 강점은 '사고 자극 기능(Thought Stimulation)'이다. 단순히 사용자가 말한 내용을 정리하는 데 그치지 않고, AI가 능동적으로 생각을 확장하도록 돕는다. "질문해줘(Ask Me Questions)" 버튼을 누르면 시스템이 현재 캔버스의 내용을 분석해 사용자가 미처 생각하지 못한 측면에 대한 질문을 생성한다. 예를 들어 창업 아이디어를 정리하는 중이라면 "목표 고객층은 누구인가요?" 같은 질문이 노드 형태로 캔버스에 추가된다.

"모순 보여줘(Show Me Conflicts)" 기능도 흥미롭다. 사용자가 말한 내용 중 논리적으로 충돌하는 부분을 AI가 자동으로 감지해 해당 노드들을 빨간 선으로 연결한다. 예를 들어 "비용을 최소화하고 싶다"는 노드와 "최고급 재료를 쓰고 싶다"는 노드가 있다면, 시스템은 이 둘 사이의 모순을 지적한다. 이는 자신의 생각에서 일관성 없는 부분을 발견하고 재고하는 데 도움을 준다.

"생각의 진화(Thought Evolution)" 기능은 시간에 따라 캔버스가 어떻게 변화했는지 시각적으로 보여준다. 처음 몇 개의 노드로 시작했던 아이디어가 점차 확장되고 재구조화되는 과정을 되돌아볼 수 있다. 이는 메타인지(Metacognition), 즉 자신의 사고 과정을 인식하고 평가하는 능력을 강화한다.

챗GPT 음성 대화보다 2배 이상 효과적

연구팀은 오럴리티의 효과를 검증하기 위해 12명의 참가자를 대상으로 실험을 진행했다. 참가자들은 오럴리티와 음성 대화 기능이 있는 챗GPT(커스텀 프롬프트로 개요와 개념도 생성 기능 추가)를 각각 사용해 자신의 생각을 정리하는 과제를 수행했다.

결과는 명확했다. 참가자 12명 중 10명이 오럴리티가 사고 과정을 더 잘 지원한다고 답했다. 특히 "생각을 명확히 하는 데 도움이 됐다"는 항목에서 오럴리티는 평균 4.5점(5점 만점)을 받았고, 챗GPT는 3.2점에 그쳤다. 참가자들은 "캔버스에서 노드를 직접 옮기며 생각을 재배치할 수 있어서 좋았다", "AI가 생성한 질문 덕분에 미처 생각하지 못한 부분을 발견했다"고 평가했다.

반면 챗GPT는 대화가 길어질수록 맥락을 잃고, 장황한 답변으로 오히려 핵심을 흐린다는 지적을 받았다. 한 참가자는 "챗GPT는 계속 새로운 정보를 추가하지만, 내 원래 생각이 뭐였는지 되돌아보기 어려웠다"고 말했다. 선형적인 채팅 인터페이스는 생각의 그물망 같은 연결 구조를 표현하기에 적합하지 않았던 것이다.

기능별 유용성 평가에서도 오럴리티의 "질문 생성" 기능과 "모순 감지" 기능은 각각 4.3점과 4.1점을 받으며 높은 점수를 기록했다. 참가자들은 특히 모순 감지 기능이 자신의 논리적 오류를 발견하는 데 유용했다고 평가했다.

회의실에서 교실까지, 확장되는 활용 가능성

오럴리티의 활용 가능성은 개인의 생각 정리를 넘어선다. 연구팀은 이 시스템이 회의, 브레인스토밍, 교육, 연구 등 다양한 맥락에서 사용될 수 있다고 제안한다. 예를 들어 팀 회의에서 참가자들이 각자 아이디어를 말하면, 오럴리티가 실시간으로 내용을 정리하고 시각화해 공유 캔버스를 만들 수 있다. 학생들은 복잡한 개념을 공부하며 자신의 이해를 음성으로 설명하고, 시스템이 생성한 질문을 통해 학습 공백을 메울 수 있다.

연구자들에게도 유용하다. 논문 아이디어를 구상하거나 연구 질문을 다듬을 때, 오럴리티를 사용해 초기 생각을 빠르게 외부화하고 구조화할 수 있다. 시스템이 생성한 질문은 연구 설계에서 놓친 변수나 가설을 발견하는 데 도움을 준다.

다만 연구팀은 몇 가지 한계도 인정한다. 현재 오럴리티는 개인 사용에 초점을 맞췄지만, 실시간 협업 기능은 아직 완전히 구현되지 않았다. 또한 음성 인식의 정확도는 사용자의 발음, 배경 소음, 언어에 따라 달라질 수 있다. 연구팀은 향후 다국어 지원과 협업 기능 강화를 계획하고 있다.

FAQ( ※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

Q. 오럴리티는 어떤 언어를 지원하나요?

A. 현재 논문에서는 영어 기반 실험 결과만 공개됐지만, 대형 언어 모델(LLM)을 기반으로 하기 때문에 다국어 지원이 기술적으로 가능합니다. 연구팀은 향후 한국어를 포함한 다양한 언어로 확장할 계획입니다.

Q. 오럴리티를 실제로 사용할 수 있나요?

A. 오럴리티는 현재 연구 단계의 프로토타입입니다. 2026년 CHI 컨퍼런스 발표 이후 상용화 여부나 공개 일정은 아직 발표되지 않았습니다. 관심 있는 사용자는 연구팀 웹사이트나 논문을 통해 향후 소식을 확인할 수 있습니다.

Q. 챗GPT 음성 모드와 오럴리티의 가장 큰 차이는 무엇인가요?

A. 챗GPT는 대화 내용이 위에서 아래로 나열되는 선형 구조인 반면, 오럴리티는 말한 내용을 주제별로 묶고 관계를 시각화하는 비선형 캔버스를 제공합니다. 사용자가 노드를 직접 옮기고 재배치할 수 있어 능동적인 사고 정리가 가능하며, AI가 생성한 질문과 모순 감지 기능으로 생각의 깊이를 더할 수 있습니다.

기사에 인용된 논문 원문은 arXiv에서 확인할 수 있다.

논문명: Orality: A Semantic Canvas for Externalizing and Clarifying Thoughts with Speech

