"네이버·카카오 보고 있나"…설립 1년차 신생기업, 70B LLM '설계도' 통째로 풀었다

트릴리온랩스가 국내 최대 규모 거대언어모델(LLM)의 훈련 과정까지 전면 공개했다. 전례 없는 수준의 개방성을 앞세워 국내 AI 기술 생태계의 주도권을 확보하려는 전략으로 풀이된다.

트릴리온랩스는 자체 개발한 700억 파라미터 규모 LLM '트리(Tri)-70B'를 10일 공개했다. 회사에 따르면 이 모델은 한국에서 프롬 스크래치로 개발된 언어모델 중 가장 큰 규모다. 사후학습이 최소화된 베이스 모델 형태라 활용성이 높다.

트릴리온랩스는 70B 모델 공개와 함께 '오픈소스 먼스'를 선언했다. ▲0.5B ▲1.8B ▲7B ▲70B에 이르는 모델 전체 라인업을 아파치 2.0 라이선스로 개방해 상업적 활용의 길을 열었다.

특히 이번 공개에서 가장 주목받는 부분은 학습 중간 과정이 담긴 체크포인트까지 전면 공개한 점이다. 이는 연구자들이 모델의 학습 과정을 정밀하게 분석하고 효율적으로 재학습할 수 있는 길을 연 것으로 평가된다. 전 세계적으로도 허깅페이스 등 소수만 시도한 방식으로 국내에서는 최초다.

공개된 모델에는 다국어 번역과 실시간 검색에 특화된 버전도 포함됐다. 검색 특화 모델은 '덕덕고' 같은 검색 엔진과 연동해 최신 정보를 즉각 반영할 수 있어 LLM의 지식 확장 가능성을 제시한다.