"논문 올리면 45초짜리 틱톡 영상 완성"… AI가 바꾸는 학술 소통의 미래

컴퓨팅입력 :2026/01/29 21:34

어려운 학술 논문을 45초짜리 짧은 영상으로 자동 변환해주는 인공지능 시스템이 나왔다. 해당 논문에 따르면, 미국 워싱턴대학교(University of Washington) 연구팀이 만든 '페이퍼톡(PaperTok)'은 AI를 활용해 연구자들이 자신의 논문을 일반인도 쉽게 볼 수 있는 영상 콘텐츠로 바꿀 수 있도록 돕는다고 밝혔다. 연구팀은 이 시스템이 학계와 일반 대중 사이의 소통 벽을 낮추는 혁신적 도구가 될 것으로 보고 있다.

소셜미디어로 뉴스 보는 시대, 학술 소통도 바뀐다

학술 논문은 과학적 발견을 나누는 중요한 매체지만, 전문 용어가 많고 구조가 복잡해 일반인이 읽기 어렵다. 2024년 퓨 리서치 센터(Pew Research Center) 조사에 따르면, 절반 이상의 사람들이 소셜미디어로 뉴스를 접한다. 2025년 조사에서는 미국 성인의 17%가 틱톡에서 정기적으로 뉴스를 본다고 답했다.

워싱턴대학교 연구팀은 이런 변화에 주목해 페이퍼톡을 개발했다. 연구자가 PDF 논문 파일을 올리면, 구글의 제미나이라는 AI가 핵심 내용을 분석하고 사람들이 이해하기 쉬운 대본을 만든다. 그다음 베오2(Veo 2)라는 AI가 대본에 맞는 영상을 제작하고, 음성 변환 AI가 목소리를 입힌다.

연구팀은 시스템을 만들기 전에 과학 콘텐츠를 만드는 전문가 8명을 인터뷰했다. 이들은 유튜브, 틱톡 등에서 과학 영상을 만드는 사람들로, 평균 5년 이상 경력자들이었다. 조사 결과, 좋은 과학 영상은 시청자의 일상과 관련이 있고 최신 이슈를 다루며, 처음 2-5초 안에 시청자의 관심을 끌어야 한다는 점을 확인했다.

45초 영상으로 논문 핵심 전달, 사람과 AI가 함께 만든다 

페이퍼톡의 가장 큰 특징은 사람이 중요한 순간마다 직접 선택하고 수정할 수 있다는 점이다. 시스템이 자동으로 4가지 영상 대본을 만들지만, 어떤 것을 쓸지는 연구자가 정한다. 연구자는 편집 도구를 통해 대본을 고치고, 목소리 톤을 조정하며, 각 장면의 영상을 다시 만들 수 있다.

영상 제작은 3단계로 진행된다.

1단계에서는 시작 문구와 대본을 고르고 목소리 스타일을 정한다. AI가 각 대본에 어울리는 목소리를 추천하지만, 연구자가 직접 바꿀 수 있다.

2단계에서는 대본을 8개 장면으로 나누고 각각에 맞는 영상을 만든다. 연구자는 장면마다 영상을 다시 만들거나 대본을 수정할 수 있다.

마지막 3단계에서는 논문 저자 정보와 만든 사람 이름을 넣은 크레딧 화면을 추가해 신뢰도를 높인다.

시작 문구를 만드는 과정은 특히 정교하다. AI는 먼저 논문에서 구체적이고 실생활과 관련된 4가지 핵심 내용을 뽑는다. 그다음 모순, 놀라움, 개인적 관심사, 호기심 같은 방법을 써서 각 내용을 흥미로운 이야기로 바꾼다. 예를 들어 "AI가 X를 일으킨다"는 확실한 말을 "AI가 X를 일으킬 수 있을까?"라는 질문으로 바꿔 과학적으로 정확하면서도 시청자의 관심을 끈다. 최종적으로 15단어 이내의 대화체 시작 문구 4개를 만들고, AI가 스스로 평가해 가장 좋은 것만 보여준다.

기존 플랫폼 압도하는 성적, 정보도 많고 재미도 있다

연구팀은 페이퍼톡의 효과를 확인하기 위해 연구자 18명과 일반인 100명에게 평가를 받았다. 참가자들은 같은 논문으로 만든 3가지 영상을 비교했다. 페이퍼톡 영상과 함께 PDFtoBrainrot, 사이스페이스(SciSpace) 같은 기존 서비스의 영상을 평가했다.

결과는 페이퍼톡이 압도적으로 좋았다. 11개 평가 항목 중 8개에서 가장 높은 점수를 받았다. 특히 정보가 많다(4.09점), 믿을 만하다(3.92점), 흥미롭다(3.91점)는 평가가 높았다. PDFtoBrainrot는 신뢰성, 정확성, 완성도 등에서 계속 낮은 점수를 받았다. 사이스페이스는 정보량에서는 페이퍼톡과 비슷했지만, 흥미도와 재미에서는 크게 떨어졌다. 페이퍼톡 영상은 참가자들이 더 많이 보고 싶어하고(3.50점), 다른 사람과 공유할 의향(3.05점)도 가장 높았다.

틱톡 영상으로 과학 소통이 가능하다는 점에서 연구자 참가자들은 페이퍼톡이 과학 소통의 문턱을 크게 낮췄다고 평가했다. 18명 모두 시스템이 쉽고 빠르다고 답했으며, 한 참가자는 "엄마도 쉽게 쓸 수 있을 것"이라고 말했다. 평균 20분이면 영상을 만들 수 있었고, 특히 눈에 띄는 콘텐츠를 만드는 데 어려움을 겪던 연구자들에게 큰 도움이 됐다. 연구자들은 페이퍼톡을 일반인에게 연구를 소개하거나, 영상 시안 제작, 내부 공유 등 다양하게 쓸 수 있다고 답했다.

크레딧 화면은 신뢰도를 높이는 장치로 특히 좋은 평가를 받았다. 자동으로 논문 저자 목록을 뽑아내고 만든 사람이 이름을 추가할 수 있는 이 기능에 대해, 참가자들은 "실제 논문이라는 걸 보여준다", "트위터의 아무 정보가 아니라는 걸 알 수 있다"고 반응했다. 일부는 발표된 학회나 연도를 넣으면 더 좋을 것 같다고 제안했다.

더 세밀한 조정 원하는 연구자들, AI의 한계도 드러나

연구자들은 페이퍼톡이 빠르고 편하다는 점을 인정하면서도 더 꼼꼼하게 조정하고 싶어했다. 자신의 연구에 대한 애정이 큰 만큼 영상이 정확해야 한다고 강조했다. 하지만 글을 영상으로 바꾸는 AI의 한계로 원하는 대로 영상을 고치기 어려운 점이 가장 큰 불만이었다. 대본은 마음에 드는데 영상의 특정 부분만 바꾸고 싶을 때 방법이 없다는 점, 갑자기 나타나는 흐릿한 글씨나 이상한 사람 모습 같은 AI 오류가 연구의 신뢰도를 떨어뜨린다는 우려가 나왔다.

일부 연구자는 AI에게 직접 명령할 수 있는 "전문가 모드"를 요청했지만, 동시에 AI에게 명령하는 것 자체가 어렵다는 점도 인정했다. 참가자들은 분위기판 제공, 목소리 억양 조정, 논문의 그림 직접 넣기 등 다양한 개선 방법을 제안했다. 흥미롭게도, 연구자들은 영상이 "너무 AI 같으면" 사람들이 싫어할 거라고 걱정했지만, 실제 일반인들의 반응은 더 너그러웠다. 일반인들은 명백한 오류가 아니면 AI 사용 자체를 문제 삼지 않았고, 내용을 이해할 수 있는지, 흥미로운지, 제작이 깔끔한지를 더 중요하게 봤다.

AI 사용에 대한 생각에서도 차이가 났다. 연구자들은 일반인보다 AI를 활용한 과학 소통에 대한 신뢰가 확실히 낮았다(2.67점 vs 3.22점). 영상이 AI로 만들어졌다는 사실을 알았을 때, 연구자의 66.7%가 신뢰도가 낮아졌다고 답한 반면, 일반인은 36%만 같은 반응을 보였다. 일반인의 55%는 AI 사용 여부가 영향을 주지 않았다고 답했다.

그래도 양쪽 모두 AI가 보조 역할을 해야 하며, 전문가가 과정에 참여해야 한다는 데 동의했다. AI가 잘못된 정보를 만들어내거나 내용을 왜곡할 수 있다는 점을 알고 있었고, 연구자가 결과물을 확인하는 게 필수라고 강조했다. 이런 이유로 페이퍼톡의 크레딧 화면이 사람이 참여했다는 걸 보여주는 신뢰 신호로 작용했다.

FAQ ( ※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

Q1. 페이퍼톡은 어떻게 논문을 영상으로 만드나요?

A. 연구자가 PDF 논문 파일을 올리면 AI가 핵심 내용을 분석해 4가지 대본 옵션을 만듭니다. 연구자가 마음에 드는 대본을 고르면 AI가 각 장면에 맞는 영상을 만들고 목소리를 입힙니다. 전체 과정은 평균 20분 정도 걸리고, 연구자는 각 단계에서 내용을 고치거나 다시 만들 수 있습니다. 

Q2. 페이퍼톡 영상은 얼마나 믿을 만한가요?

A. 페이퍼톡은 마지막에 크레딧 화면을 넣어서 원래 논문 저자와 영상 만든 사람 정보를 보여줍니다. 이를 통해 연구자가 내용을 확인했다는 걸 알 수 있고, 시청자가 원래 논문을 찾아볼 수 있습니다. 평가에서 이 크레딧 화면이 강력한 신뢰 신호로 작용했고, 참가자들은 이를 통해 검증된 학술 연구라는 걸 알 수 있었다고 답했습니다. 

Q3. 기존 서비스와 페이퍼톡의 차이는 뭔가요?

관련기사

A. PDFtoBrainrot이나 사이스페이스 같은 기존 서비스는 자동 생성에 더 많이 의존합니다. 반면 페이퍼톡은 연구자가 대본 선택, 목소리 조정, 장면별 영상 다시 만들기 등 제작 과정에 직접 참여하는 방식입니다. 평가 결과 페이퍼톡 영상은 정보량과 흥미도 모두에서 기존 서비스를 앞섰고, 시청자들의 공유 의향도 가장 높았습니다. 

■ 이 기사는 AI 전문 매체 ‘AI 매터스’와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)