중국 AI 스타트업 문샷AI가 마치 100명의 직원처럼 동시에 일하는 인공지능 모델 '키미 K2.5(Kimi K2.5)'를 공개했다. 해당 논문에 따르면, 한 명의 AI가 아니라 여러 개의 AI가 협력해서 일하는 방식으로, 기존보다 작업 속도를 최대 4.5배 빠르게 만들었다고 밝혔다. 특히 그림이나 영상만 보여줘도 바로 코드를 짜는 능력이 뛰어나 개발자들의 주목을 받고 있다.

혼자가 아닌 100명... AI가 스스로 팀을 만들어 일한다

키미 K2.5의 가장 놀라운 기능은 '에이전트 스웜(agent swarm)'이라는 기술이다. 쉽게 말해 AI 한 명이 복잡한 일을 받으면, 스스로 이 일을 잘게 쪼개서 최대 100개의 작은 AI들(서브 에이전트)에게 나눠준다. 그리고 이 100개의 AI들이 동시에 각자 맡은 일을 처리한다. 마치 프로젝트 매니저가 팀원들에게 업무를 분담하는 것과 비슷하다.

신기한 점은 이 모든 과정을 AI가 알아서 한다는 것이다. 사람이 미리 "이런 일은 이렇게 나눠라"고 가르쳐주지 않아도, AI가 상황을 보고 스스로 판단해서 팀을 만들고 일을 분배한다. 이 과정에서 최대 1,500번의 도구 사용이 동시에 일어난다.

실제 사례를 보면 더 이해하기 쉽다. 100개의 다양한 분야에서 인기 유튜버 상위 3명씩을 찾는다고 해보자. K2.5는 먼저 각 분야가 무엇인지 조사하고 정의한다. 그다음 스스로 100개의 작은 AI를 만들어서 각 AI에게 한 분야씩 맡긴다. 각 AI는 자기가 맡은 분야에서 인기 유튜버를 찾아낸다. 마지막으로 모든 결과를 모아 300명의 유튜버 정보를 깔끔하게 정리된 엑셀 파일로 만들어준다.

이런 방식으로 일하면 얼마나 빨라질까? 문샷AI의 테스트 결과, 같은 수준의 결과를 내는 데 걸리는 시간이 3분의 1에서 5분의 1 수준으로 줄어들었다. 다시 말해 최대 4.5배 빠르게 일을 끝낼 수 있다는 뜻이다.

이 기술은 'PARL'이라는 특별한 학습 방법으로 만들어졌다. AI가 여러 번의 시행착오를 거치면서 "어떤 일을 어떻게 나누면 가장 빠르게 끝낼 수 있을까?"를 스스로 배운 것이다. 문샷AI는 이때 '가장 오래 걸리는 단계'를 기준으로 성능을 평가했다. 아무리 많은 AI를 동원해도 가장 느린 AI 때문에 전체가 지연된다면 의미가 없기 때문이다.

그림만 보여줘도 웹사이트를 만든다... 눈으로 코딩하는 AI

K2.5는 현재 공개된 오픈소스 AI 중에서 프로그래밍 능력이 가장 뛰어나다고 평가받는다. 특히 웹사이트 화면을 만드는 '프론트엔드 개발' 분야에서 두각을 나타낸다. 간단한 대화만으로도 완성도 높은 웹사이트를 뚝딱 만들어낸다. 화면을 스크롤하면 나타나는 효과나 움직이는 애니메이션까지 구현한다.

더 놀라운 건 K2.5가 이미지나 영상을 보고 코드를 짠다는 점이다. 예를 들어 웹사이트 디자인 시안 이미지를 보여주면, 그대로 작동하는 코드를 만들어준다. 영상으로 웹사이트 작동 방식을 보여줘도 똑같이 구현할 수 있다. 실제로 K2.5는 웹사이트가 작동하는 영상을 보고 그 사이트를 재현하는 데 성공했다.

어떻게 이런 일이 가능할까? K2.5는 학습할 때 이미지와 글을 합쳐 약 15조 단위의 데이터를 배웠다. 그래서 이미지를 이해하는 능력과 글을 이해하는 능력이 따로 떨어져 있지 않고 하나로 연결돼 있다. 마치 우리가 사진을 보면서 설명을 듣는 것처럼, AI도 이미지와 텍스트를 동시에 이해할 수 있다는 뜻이다.

재미있는 예시도 있다. 복잡한 미로 그림을 보여주고 "왼쪽 위 초록점에서 오른쪽 아래 빨간점까지 가장 빠른 길을 찾아줘"라고 하자, K2.5는 최단거리 찾기 방법을 사용해 113,557걸음의 최적 경로를 찾아내고 이를 색깔로 표시한 이미지까지 만들어줬다.

문샷AI는 실제 소프트웨어 개발 능력을 측정하기 위해 자체 테스트를 만들었다. 프로그램 만들기부터 버그 고치기, 코드 정리하기, 테스트 짜기까지 다양한 실무 작업을 여러 프로그래밍 언어로 평가한다. K2.5는 이전 버전인 K2보다 모든 영역에서 눈에 띄게 발전했다.

시간도 비용도 확 줄었다... 실전 성능도 검증됐다

에이전트 스웜이 진짜로 효과가 있을까? 문샷AI가 실제로 테스트해본 결과, 작업 시간이 80%나 줄어들었다. 10시간 걸리던 일이 2시간 만에 끝난다는 뜻이다. 덕분에 훨씬 복잡하고 오래 걸리는 작업도 처리할 수 있게 됐다.

실제 AI 성능 테스트에서도 우수한 결과를 보였다. HLE, BrowseComp, SWE-Verified라는 세 가지 테스트에서 K2.5는 적은 비용으로 높은 점수를 받았다. 특히 BrowseComp라는 웹 검색 테스트에서 에이전트 스웜을 사용했을 때 78.4%의 정확도를 기록했다. 일반 방식(74.9%)보다 더 좋은 성적이다.

프로그래밍 실력 테스트에서도 좋은 성과를 냈다. SWE-Bench Verified에서 76.8%, SWE-Bench Pro에서 50.7%, SWE-Bench Multilingual에서 73.0%를 기록했다. 이는 GPT-5.2, 클로드 4.5 오푸스, 딥시크 V3.2 같은 유명 AI들과 비교해도 밀리지 않는 수준이다.

이미지 이해 능력 테스트에서도 우수했다. MMMU-Pro에서 78.5%, MathVision에서 84.2%, OmniDocBench 1.5에서 88.8%를 받았다. 이는 K2.5가 이미지를 보고 이해하는 능력과 코드를 짜는 능력을 모두 갖췄다는 걸 보여준다.

보고서도 발표 자료도 알아서 뚝딱... 사무 업무의 혁명

키미 K2.5는 단순히 코드만 짜는 게 아니라 실제 회사 업무도 처리할 수 있다. 대화만으로 워드 문서, 엑셀, PDF, 파워포인트를 전문가 수준으로 만들어준다. 복잡하고 양이 많은 자료를 분석해서 완성도 높은 결과물을 내놓는다.

문샷AI는 실제 업무 능력을 측정하기 위해 두 가지 테스트를 만들었다. 하나는 오피스 프로그램 결과물의 품질을 평가하는 것이고, 다른 하나는 여러 단계를 거치는 복잡한 업무를 사람 전문가와 비교하는 것이다. K2.5는 이 두 테스트에서 이전 버전 대비 각각 59.3%와 24.3% 향상된 성적을 거뒀다.

K2.5가 할 수 있는 일은 다양하다. 워드 문서에 메모를 추가하거나, 엑셀에서 피벗 테이블로 재무 계산을 하거나, PDF에 복잡한 수식을 넣을 수 있다. 심지어 10,000단어짜리 논문이나 100페이지 분량의 보고서도 만들어낸다.

과거에는 며칠씩 걸렸던 일이 이제는 몇 분 만에 끝난다. 예를 들어 100장면짜리 스토리보드를 이미지와 함께 엑셀로 만드는 작업도 순식간에 완료된다. 이는 사무직 직원들의 업무 방식을 크게 바꿀 수 있는 변화다.

AI 협업 시대, 한국도 주목해야 할 이유

키미 K2.5가 보여준 '여러 AI가 협력하는' 방식은 AI 발전의 새로운 방향을 제시한다. 지금까지는 AI 모델을 더 크게, 더 강하게 만드는 데 집중했다면, 이제는 여러 AI가 똑똑하게 협력하는 방법으로 전환하고 있다. 이는 단순히 AI를 키우는 게 아니라, 일을 잘 나누고 동시에 처리하는 방식으로 효율과 성능을 모두 높이는 접근법이다.

한국 AI 기업들도 이런 변화에 주목할 필요가 있다. 거대 AI 모델을 만드는 경쟁에서는 자금과 규모 면에서 불리한 국내 기업들이, AI들을 잘 협력시키는 기술로 새로운 기회를 찾을 수 있기 때문이다. 특히 특정 분야에 특화된 작은 AI들을 효과적으로 지휘하는 기술은 범용 AI를 개발하는 것보다 진입하기 쉬우면서도 실용성이 높다.

또한 K2.5가 무료로 공개된다는 점도 중요하다. 키미 웹사이트, 앱, API, 그리고 개발자용 도구인 키미 코드를 통해 누구나 사용할 수 있다. 이는 국내 개발자와 연구자들이 최신 AI 협업 기술을 직접 사용해보고 응용할 수 있는 기회를 준다.

그림으로 코드를 짜는 능력도 국내 소프트웨어 산업에 중요하다. 디자이너가 만든 화면 시안을 AI가 바로 코드로 만들어주거나, 다른 웹사이트 영상을 보고 비슷한 기능을 구현하는 능력은 개발 시간을 획기적으로 줄여준다. 이는 코드를 직접 쓰지 않고도 프로그램을 만드는 도구의 수준을 한 단계 끌어올리는 기술로, 개발자가 부족한 국내 스타트업들에게 큰 도움이 될 수 있다.

마지막으로 K2.5의 사무 업무 기능은 AI가 단순히 창작 도구가 아니라 실제 업무 자동화 도구로 진화하고 있음을 보여준다. 복잡한 재무 계산, 100페이지 보고서 작성, 이미지가 들어간 발표 자료 자동 생성 등은 사무직 업무의 상당 부분을 AI가 대신할 수 있다는 의미다.

FAQ (※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

Q1. 에이전트 스웜이 뭔가요? 기존 AI와 뭐가 다른가요?

A. 에이전트 스웜은 AI 한 명이 아니라 여러 명의 AI가 팀을 이뤄 일하는 방식입니다. 기존 AI는 할 일을 하나씩 차례로 처리했다면, 에이전트 스웜은 복잡한 일을 자동으로 여러 개의 작은 일로 쪼개서 각각 다른 AI에게 맡깁니다. 그래서 모든 AI가 동시에 일하기 때문에 훨씬 빠릅니다. 키미 K2.5는 이 방식으로 같은 일을 최대 4.5배 빠르게 끝낼 수 있습니다.

Q2. 그림만 보고 코드를 짠다는 게 무슨 뜻인가요?

A. 웹사이트 디자인 이미지나 영상을 AI에게 보여주면, AI가 그대로 작동하는 코드를 자동으로 만들어주는 겁니다. 예를 들어 "이런 모양의 웹사이트를 만들어줘"라고 하면서 그림을 보여주면, AI가 HTML, CSS, Javascript 같은 코드를 짜서 똑같이 작동하는 웹사이트를 만들어줍니다. 또 화면에 문제가 있는 걸 보고 버그를 찾아서 고칠 수도 있습니다. 개발자가 디자인을 일일이 코드로 옮기는 수고를 덜어주는 기술입니다.

Q3. 키미 K2.5는 어떻게 사용할 수 있나요?

A. 여러 방법으로 사용 가능합니다. 웹 브라우저에서 키미 웹사이트에 접속하거나, 스마트폰에 키미 앱을 설치하면 바로 쓸 수 있습니다. 개발자라면 API를 통해 자기 프로그램에 연결하거나, 명령창에서 쓰는 '키미 코드'를 설치해서 VSCode, Cursor 같은 개발 도구와 함께 사용할 수 있습니다. 현재 키미 K2.5 인스턴트, K2.5 씽킹, K2.5 에이전트, K2.5 에이전트 스웜(베타) 등 4가지 모드가 있고, 에이전트 스웜은 유료 회원에게 무료 체험판으로 제공되고 있습니다.

기사에 인용된 리포트 원문은 키미 공식 블로그에서 확인 가능하다.

■ 이 기사는 AI 전문 매체 ‘AI 매터스’와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)