우주 AI 종합 솔루션 기업 텔레픽스(TelePIX, 대표 조성익)는 항공우주 도메인 모델인 ‘픽시1.0(PIXIE-v1.0)’이 글로벌 인공지능(AI) 성능 평가에서 세계 2위에 랭크됐다고 3일 밝혔다.

항공우주라는 전문 분야만으로 따졌을 때는 실질적인 1위다. 다른 경쟁업체는 대부분 법률이나 금융 등 범용 모델을 내놨다.

픽시1.0은 항공우주·위성·국방 등의 전문 기술 문서를 대상으로 의미 기반 검색이 가능한 도메인 특화 정보 검색 모델이다. 위성 설계 문서, 기술 규격서, 운용 매뉴얼 등 방대한 항공우주 기술 문서를 자연어 질의로 보다 수월하게 검색할 수 있다.

텔레픽스 항공우주 도메인 검색 모델 '픽시 v1.0'이 AI 성능 세계 2위를 기록했다.(그림=텔레픽스)

이 모델은 텔레픽스가 만든 위성용 에이전트 AI 솔루션 샛챗(SatCHAT) 성능 고도화를 위해 개발됐다.

권다롱새 텔레픽스 데이터사이언스 부문장은 "픽시 프리뷰(PIXIE-Preview)에 이어 이번 1.0에서는 도메인 특화 검색 성능을 정량적으로 검증하는 데 중점을 뒀다"고 말했다.

이 모델은 최근 허깅페이스(Hugging Face) 플랫폼을 통해 공개된 글로벌 검색 벤치마크 '검색 임베딩 성능 평가 지표(RTEB)' 매개변수 10억(1B)개 이하 모델 부문에서 세계 2위를 기록했다. 이 부문에는 글로벌 빅테크와 연구기관이 공개한 다수 임베딩 모델이 포함돼 있다.

RTEB는 기존 임베딩 모델 평가 표준으로 활용돼 온 '대량 텍스트 임베딩 벤치마크 리더보드(MTEB)'를 확장한 차세대 검색 벤치마크다. 테스트 데이터 위주 점수 경쟁이 아닌 실제 산업 환경에서 AI 모델 정보 검색 성능을 평가하는 데 초점을 맞췄다. 법률·금융·의료·코드 등 고난도 도메인을 기반으로 실질적인 산업 활용 가능성을 검증할 수 있다.

권다롱새 부문장은 "해당 부문 1위 모델을 포함해 대부분은 법률·금융·의료·코드 등 여러 도메인을 포괄하는 범용 모델인 반면, 픽시1.0은 항공우주 도메인과 한·영 기술 문서에 집중했음에도 글로벌 상위권 성과를 냈다"고 설명했다.

텔레픽스는 RTEB에서 직접적으로 다루지 않는 한국어를 포함한 다국어 항공우주 도메인 검색 성능을 검증하기 위해 자체 구축한 검색 벤치마크 ‘스텔라(STELLA)’를 활용한 추가 평가를 진행했다.

평가 결과 픽시1.0은 파라미터 규모 대비 우수한 검색 정확도를 나타냈고, 언어·도메인 특화 검색 역량을 안정적으로 확보한 것도 확인했다고 텔레픽스 측은 덧붙였다.

스텔라는 항공우주 전문 문서를 기반으로 구성된 다국어 정보 검색 벤치마크로, 항공우주 도메인에 특화된 공개 검색 평가 기준이 거의 없는 현실적 한계를 보완하기 위해 설계됐다.

텔레픽스는 픽시1.0을 오픈소스로 공개하고, RAG 기반 AI 시스템에서 전문 기술 문서 검색을 위한 핵심 모델로 활용될 수 있을 것으로 기대했다.

텔레픽스는 향후 위성 산업에서 유용하게 활용 가능한 AI 모델과 솔루션 고도화에 집중할 계획이다.