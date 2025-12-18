과학기술정보통신부(과기정통부)와 한국데이터산업진흥원(K-DATA, 원장 양재수)이 AI시대를 맞아 데이터 품질 및 관리체계가 우수한 기업을 발굴, 시상하는 ‘2025년 데이터 품질대상’ 시상식이 18일 오후 서울 코엑스 컨퍼런스룸 E1에서 열렸다.

이번 '데이터 품질대상'은 AI·데이터 시대를 맞아 데이터 품질·관리 역량 강화 및 품질인증제도의 인식 제고를 목적으로 마련한 것으로, 국내 최고 데이터 품질 우수기업을 발굴하고 전파하기 위한 시상제도다. 지난 1997년 '우수데이터베이스 대상'으로 시작, 올해가 29회다.

올해는 지난 10월 23일~11월 21일 약 한달간 접수를 받았고, 높은 경쟁률 속에 심사결과 플리토가 한국데이터산업진흥원(K-DATA) 원장상을 수상했다. 아래는 이정수 플리토 대표와 일문일답 인터뷰.

플리토 김진구 CDO(오른쪽)가 이정현 한국데이터산업진흥원 본부장에게서 상을 받고 있다.

-수상을 축하합니다. 플리토는 어떤 기업인가요?

"플리토는 2012년 8월, 글로벌 환경에서 언어 장벽을 해소하고 언어 데이터를 새로운 가치로 만들기 위해 설립된 AI 데이터 및 솔루션 전문 기업입니다. 현재는 AI 학습용 데이터 구축·가공 및 언어 데이터 사업을 주력으로 하고 있고, 글로벌 시장을 대상으로 다국어·대규모 고품질 AI 데이터를 공급하고 있습니다. 현재 약 200명 규모의 임직원이 AI 데이터 품질과 기술 경쟁력 강화를 위해 함께하고 있습니다."

-수상 소감은요?

"이번 데이터 품질대상 수상은 단순히 하나의 성과라기보다, 플리토가 오랫동안 축적해 온 데이터 품질 관리에 대한 철학과 운영 방식이 공인 기준으로 인정받았다는 점에서 매우 뜻깊게 생각합니다. 특히 추론형 AI 데이터처럼 정성적 판단이 많이 개입되는 영역에서, 품질을 주관적인 평가가 아닌 ‘측정 가능한 기준’으로 관리해 왔던 노력이 의미 있는 결과로 이어졌다고 생각합니다.

또한 이번 수상은 플리토 혼자만의 결과라기보다, K-DATA의 데이터 품질인증 지원사업을 통해 체계적인 점검과 개선의 기회를 얻었기 때문에 가능했다는 점에서 더욱 감사한 마음입니다. 앞으로도 이번 수상을 계기로, 데이터 품질이 곧 AI 신뢰도라는 인식을 시장에 확산시키는 데 기여하고 싶습니다."

-어떤 서비스와 어떤 노력을 통해 수상한건가요?

"이번에 플리토가 데이터 품질대상을 수상하게 된 가장 큰 이유는, 단순하게 글로벌 기준을 번역하거나 차용한 데이터가 아니라, 한국어 특성과 한국 사회·문화 맥락을 반영한 ‘한국형 논리추론(CoT,Chain of Thought) 데이터’를 체계적으로 구축하고, 이를 공인 품질 기준으로 검증받았다는 점이라고 생각합니다.

최근 LLM과 추론형 AI 경쟁이 본격화하면서, 단순한 문장 데이터가 아니라 ‘사고 과정’을 학습시키는 CoT 데이터의 중요성이 크게 부각되고 있습니다. 하지만 기존 CoT 데이터 상당수는 영어권 데이터이거나, 한국어로 단순 변환된 형태가 많아 한국어 특유의 논리 전개 방식, 문장 구조, 맥락 이해를 충분히 반영하지 못하는 한계가 있었습니다.플리토는 이러한 문제의식에서 출발해, 한국어 환경에 최적화된 논리 전개 방식과 도메인 특성을 반영한 ‘한국형 CoT 데이터’를 처음부터 설계했습니다.

이를 위해 문제 정의부터 단계별 추론, 최종 답변까지의 구조를 표준화하고, 사회문화·경제·수학·과학·기술 등 다양한 도메인에서 한국적 맥락을 자연스럽게 반영한 추론 과제를 구성했습니다. 또 추론 데이터 특성상 작은 오류도 전체 품질에 큰 영향을 줄 수 있기 때문에, Human-in-the-loop 기반 이중 검수 체계와 표준화된 메타데이터 관리, 자동 점검을 결합한 품질관리 프로세스를 운영했습니다.

이러한 노력의 결과, 해당 데이터는 TTA 품질인증 심사에서 평균 99.88%, Class A 등급을 획득하며 정확성·구조·정합성 전반에서 우수한 평가를 받았습니다. 이는 단순히 데이터 일부가 잘 만들어졌다는 의미가 아니라, 한국형 추론 데이터를 대규모로 안정적으로 생산·관리할 수 있는 체계를 갖췄다는 점을 공인 기준으로 검증받았다는 데 의미가 있습니다.

이처럼 한국형 고품질 추론 데이터 구축 역량과 공인 품질인증을 통해 확보한 신뢰는 이후 ‘독자 AI 파운데이션 모델 프로젝트(WBL)’ 참여로 자연스럽게 이어졌습니다. 플리토는 업스테이지 컨소시엄과 함께 WBL 프로젝트의 5개 정예팀 중 하나로 선정됐고, 컨소시엄 안에서 데이터 총괄 파트너 역할을 맡고 있습니다. 이는 국가 차원의 AI 모델 개발 과정에서, 한국형 데이터의 중요성과 플리토의 데이터 품질 경쟁력이 동시에 인정받은 사례라고 생각합니다.

이번 수상은 단순한 성과를 넘어, 한국형 AI 데이터가 글로벌 모델 경쟁력의 핵심 자산이 될 수 있다는 점을 보여준 의미 있는 사례이며, 플리토는 앞으로도 데이터의 품질 기준을 지속적으로 고도화해 나갈 계획입니다."

-이 제도에 대해 좋은 점이나, 혹시 개선할 점이 있으면 말해주세요

"데이터 품질인증 제도의 가장 큰 장점은, 기업 입장에서 데이터의 품질에 대해 객관적인 기준으로 검증받을 수 있다는 점이라고 생각합니다. 특히 AI 데이터는 외부에서 품질을 판단하기 어려운 경우가 많은데, 이번 제도를 통해 품질 수준을 수치와 기준으로 설명할 수 있는 공통 언어를 갖게 된 점이 매우 유용했습니다.

또한 인증 과정 자체가 단순 평가에 그치지 않고, 기업이 스스로 데이터 품질 관리체계를 점검하고 개선할 수 있도록 유도하는 구조라는 점도 긍정적으로 평가하고 싶습니다. 실제로 플리토 역시 인증을 준비하면서 내부 가이드라인, 검수 기준, 교육 체계를 한 단계 더 고도화할 수 있었습니다. 이러한 제도를 통해 국내 AI 데이터 산업 전반의 품질 수준을 끌어올리는 데 매우 중요한 역할을 하고 있으며, 플리토 역시 앞으로도 적극적으로 활용하고 참여하고 싶습니다."