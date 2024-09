한국어 기반 거대언어모델(LLM)을 개발하는 트릴리온랩스(Trillion Labs)가 420만 달러(약 57억 원) 규모 프리시드 투자를 유치했다고 10일 밝혔다. 이번 투자는 스트롱벤처스 리드로 카카오벤처스, 베이스인베스트먼트, 더벤처스, 미국 소재 굿워터캐피탈(Goodwater Capital) 및 뱀 벤처스(BAM Ventures)가 참여했다.

트릴리온랩스는 한국에 특화된 LLM 파운데이션 모델을 만드는 스타트업이다. 대규모 한국어 데이터에 기반해 사전 훈련한 (Pre-trained) 모델로 한국 문화와 관습을 정확히 이해하는 생성 AI를 만들 계획이다. 영미권 LLM을 기반으로 만든 제품에서 일어날 수 있는 편향성 문제를 해결하고 한국에 특화한 정보를 활용할 수 있게 개발한다. 세계적으로 AI 패권 경쟁이 심화되고 소버린 AI(Sovereign AI) 가 주목받는 상황에서 디지털 시대 AI 주권을 확보하는데 기여한다는 목표다.

회사는 "AI가 다양한 분야에서 혁신을 이끌 것이라는 전망 속에서 영어권 LLM 시장이 빠르게 성장하고 있다. 일본, 중국, 인도네시아 등의 비영어권 역시 자국 언어를 기반으로 한 AI모델 개발에 속도를 내고 있다"면서 "영어를 기반으로 한 AI를 활용할 경우 성능을 100% 활용하기 어렵고, 자국 문화와 정서를 온전히 반영하지 못한 LLM에 종속 시 향후 AI 기반 산업에서 힘을 잃을 수 있다는 우려 때문이다. 이런 상황에서 트릴리온랩스는 한국이 특히 강점을 갖는 콘텐츠, 첨단 제조업 등 핵심 산업군이 한국형 LLM을 통해 경쟁력을 강화할 수 있도록 힘을 보탤 예정"이라고 말했다.

트릴리온랩스는 네이버 하이퍼클로버X 개발 핵심 연구원으로 참여한 신재민 대표를 주축으로 국내와 해외 대학에서 LLM 모델을 설계하고 연구를 이어온 인재들로 꾸려진 팀이다. 신 대표는 2017년부터 자연어 처리 및 LLM 관련 연구를 지속했다. 세계 권위의 자연어 처리 학회인 ACL(Association for Computational Linguistics), EMNLP(Empirical Methods in Natural Language Processing)와 세계적 AI학회 ICLR (International Conference on Learning Representations) 등에 다년간 논문을 발표했다. 회사는 "최근 신 대표가 발표한 합성 데이터 관련 논문은 학계 주목을 받으며 국내에서 손꼽히는 LLM 전문가로 인정받고 있다"고 밝혔다.

투자 유치를 기점으로 트릴리온랩스는 양질의 언어 데이터를 공격적으로 확보하고 기술 고도화에 집중할 예정이다. 올해 말까지 한국어를 가장 정확히 이해하고 답하는 LLM 파운데이션 모델을 완성한다는 구상이다. 나아가 언어 배열에서 유사성을 갖는 일본, 동남아 등으로 보폭을 넓히고 아시아 특화 AI 전진기지로 자리 잡는다는 계획이다.

이번 투자를 이끈 신득환 스트롱벤처스 책임 심사역은 "트릴리온랩스는 한국어를 기반으로 한 LLM을 통해 소버린 AI를 구현할 수 있는 팀”이라며 "장기적으로 한국의 AI 산업뿐 아니라 AI를 활용하는 모든 영역에서 이질감 없는 혁신을 이끌 것으로 기대한다”고 밝혔다. 김영무 카카오벤처스 심사역은 "이전엔 누구도 쉽게 도전할 수 없었던 사전 훈련부터 다시 개발해 완전히 독자적인 한국어 기반 LLM을 만들겠다는 트릴리온랩스의 공격적인 비전에 큰 감명을 받았다”며 “트릴리온랩스가 만들어 낼 한국어 기반 LLM이 AI 주도권 확보에 기여하길 바란다”고 말했다.

신재민 트릴리온랩스 대표는 “AI주권을 확보하지 못하면 타 국가 대비 부족한 AI 성능만 활용해 AI 시대를 맞이해야 할 것이라며 “트릴리온랩스가 만들 한국형 LLM을 통해 AI 선진국으로 확고한 입지를 다지고, 생성형AI 시장에서 상대적으로 소외 받는 언어권인 동북아시아도 시장 선두를 이끌 수 있다는 걸 보여주도록 성장하겠다”고 전했다.