AI전문 상장사인 아크릴(대표 박외진)은 자체 개발한 의료 특화 파운데이션 모델 ‘아름.H(ALLM.H)’가 한국 의사국가시험(KMLE) 기출문항 기반 의료 AI 평가 벤치마크인 ‘KorMedMCQA Doctor Test’에서 96.78%의 정답률을 기록, 현존 최고 성능(SOTA)을 달성했다고 14일 밝혔다.
이는 앤트로픽의 ‘Claude Opus4(96.55%)’, 오픈AI의 ‘GPT-5.1(90.11%)’, 구글 Gemini 2.5 Pro(90.8%)’를 모두 웃도는 수준으로, 국내 의료 특화 AI 모델의 경쟁력을 입증한 사례로 의미가 크다고 회사는 설명했다.
오픈소스 의료 AI 분야에서도 이번 결과는 주목할만 하다. 'ALLM.H'는 서울대병원이 개발한 오픈소스 의료 모델 ‘HARI(89.2%)’를 7.58%p 앞섰다고 회사는 밝혔다. 특히, K-Med.ai가 실제 KMLE에서 달성한 96.4%에 비견되는 수준의 성능을 72B(파라미터가 720억개) 이상의 초대형 모델이 아닌 31B 규모의 경량 오픈소스 모델로 구현했다. 모델 규모를 키우는 방식이 아니라, 고품질 데이터 구성과 정교한 학습·추론 파이프라인 설계를 통해 특화 분야 성능을 끌어올린 것이다.
또 'ALLM.H'는 아크릴이 독자 개발한 산업 특화 파운데이션 모델 '패밀리 ALLM(Acryl LLM)'의 첫 번째 결과물이기도 한데, 의료·헬스케어 분야에 특화해 개발했다. 아크릴은 2024년 Weights & Biases(W&B)가 운영하는 한국어 LLM 리더보드 ‘호랑이 벤치(Open Ko-LLM Leaderboard)’에서 오픈소스 부문 1위를 기록하며 파인튜닝 역량을 입증한 바 있다. 이후 축적한 고성능 모델 학습 노하우를 바탕으로 산업별 특화 파운데이션 모델 개발에 착수했으며, 'ALLM.H'는 그 전략의 첫 성과물이다.
'ALLM.H'는 구글의 최신 오픈소스 모델 ‘Gemma 4(31B)’를 기반으로 국내 최초 파인튜닝을 거쳐 개발했다. 2022년부터 2024년까지의 KMLE 공식 기출 435문항으로 구성된 KorMedMCQA Doctor Test에서 최고 수준의 성능을 낸 배경에는 아크릴이 보유한 데이터 정제 역량과 도메인 특화 학습 설계 역량이 있다. 아크릴은 "이번 성과를 통해 국내 특화 파운데이션 모델이 해외 빅테크의 대형 상용 모델과도 충분히 경쟁할 수 있음을 입증했다"고 강조했다.
아크릴은 'ALLM.H'를 단일 모델에 그치지 않고, 진료과별 특성을 반영한 패밀리’ 구조로 확장해 나갈 계획이다. ALLM.H를 앵커 모델로 삼아 각 전문 진료과에 최적화된 AI 생태계를 구축하고, 후속 모델들의 성능과 벤치마크 결과도 순차적으로 공개할 예정이다. 이를 통해 실제 의료 현장에서 활용 가능한 전문 의료 AI 체계를 단계적으로 고도화한다는 방침이다.
'ALLM.H'와 'ALLM.H 패밀리' 모델은 현재 아크릴이 수행 중인 보건복지부·과학기술정보통신부 주관 ‘닥터앤서 3.0’ 및 ‘K-ARPA’ 사업을 기반으로 국내 대형 병원에서 실증에 돌입할 예정이다. 연세의료원, 경북대학교병원 등 협력 병원을 중심으로 의료진의 임상 의사결정 지원, 의료 데이터 분석, 전문 진료과 상담 보조 등에 활용되며, 온프레미스 방식으로 배포돼 환자 데이터 보안까지 확보할 계획이다. 연구실 수준의 데모를 넘어 실제 임상 환경에서 작동하는 의료 AI로 검증하겠다는 것이 회사측 설명이다.
관련기사
- 아크릴 'GPU 베이스', 데이터센터 GPU 성능 25배 향상 입증2026.04.07
- 아크릴, 국산SW 기반 AI칩 1000~3000장 성능 검증2026.03.31
- "AI개발사 넘어 AI산업 선도"...아크릴, 창립 15주년 기념식2026.03.26
- 코스피 한 달 여만에 6000 재진입…3%대 올랐다2026.04.14
박외진 아크릴 대표는 “ALLM.H는 아크릴이 보유한 대규모 모델 학습·평가 인프라와 LLM 평가 플랫폼 ‘조나단(Jonathan)’을 통해 축적한 모델 최적화 노하우를 결합한 결과물”이라며 “31B 규모 모델로 Claude Opus 4와 GPT-5.1을 넘어서는 성능을 달성한 것은 모델의 크기보다 데이터 전략과 학습 파이프라인 설계가 핵심이라는 점을 보여준다”고 말했다.
이어 “이번에 검증된 특화 파인튜닝 기술은 향후 '조나단' 플랫폼에 탑재해 의료 뿐 아니라 금융, 법률, 제조 등 다양한 산업 도메인으로 확장할 예정”이라며 “고객이 자체 도메인 데이터만 보유하면 특화 모델의 학습부터 평가, 배포까지 가능한 엔드투엔드 파이프라인을 제공, 산업별 AI 내재화를 앞당길 것”이라고 밝혔다.











