미국 빅테크가 인공지능(AI) 시스템 관리·안전성 강화를 위해 각기 다른 방식으로 대응책을 마련하고 있다. 목적에 따라 자동추론·데이터 연결·안전성 관리 등 서로 다른 해법을 제시하며 AI 환각 현상 방지와 정확성 높이기에 나섰다.

29일 업계에 따르면 최근 아마존웹서비스(AWS)를 비롯한 구글, 마이크로소프트가 AI 오류를 최소화하기 위해 이같은 전략을 강화하고 있는 것으로 전해졌다. 단순히 검색증강생성(RAG)을 적용하는 단계를 넘어 AI 신뢰성을 한 단계 업그레이드했다는 설명이다.

AWS는 '자동추론' 기능을 자체 개발해 AI 답변 정확도를 검증하고 있다. 자동추론은 사람이 일일이 확인하지 않아도 수학적 논리를 적용해 AI가 낸 답이 맞는지 검증하는 방식이다. AI가 잘못된 사실을 답변하지 않았는지, 보안 규칙에 맞게 작동하는지를 기계가 직접 증명할 수 있다. 비즈니스 규칙과 도메인 지식에 따라 AI 출력이 적합한지 확인하는 원리다. 응답 신뢰도를 최대 99%까지 올릴 수 있다.

미국 빅테크가 AI 시스템 관리·안전성 강화를 위해 각기 다른 방식으로 대응책을 마련하고 있다. (사진=챗GPT)

자동추론 기능은 아마존 베드록과 접근권한 관리(IAM), S3 등 자체 클라우드 서비스에 적용됐다. AWS 네하 룽타 아이덴티티 부문 응용과학 디렉터는 "사용자 정보가 외부로 나가지 않도록 하려면 프롬프트 입력과 출력 경로가 항상 안전한지 수학적으로 검증해야 한다"며 "여기서 자동 추론은 단순한 확률 계산이 아니라 '절대 유출되지 않는다'는 것을 논리적으로 증명한다"고 설명했다.

구글은 AI 응답에 활용되는 데이터를 관리하는 방식에 초점 맞췄다. 특히 '버텍스AI'에 모델의 답변을 외부 데이터와 직접 연결하는 '그라운딩 API'을 적용해 오류를 줄이고 있다. AI가 멋대로 추측하지 않고 실제 데이터베이스(DB)나 검색 자료를 참고하도록 만들어 환각을 최소화하는 식이다. 이는 검증된 자료를 활용해 오류 가능성을 줄이는 원리다.

마이크로소프트는 기업과 공공기관을 겨냥해 AI 안전 기능을 강화하고 있다는 평가를 받고 있다. 마이크로소프트는 이런 위험을 막기 위해 애저 오픈AI에서 AI 응답을 체계적으로 관리하고 통제할 수 있는 기능을 제공한다.

대표적인 기능이 '콘텐츠 안전성(Content Safety)'이다. 이 기능은 AI가 불법적이거나 공격적인 답변을 내지 못하도록 자동으로 걸러낸다. 예를 들어 학생이 질문했을 때 욕설이나 부적절한 표현이 섞인 답변이 나오지 않도록 미리 차단할 수 있다. 또 다른 기능인 '가드레일(Guardrails)'은 대화가 위험하거나 잘못된 방향으로 흐르지 않게 막아주는 역할을 한다.

나타샤 크램프턴 마이크로소프트 책임 AI 총괄은 "국경을 넘어 AI 기술 도입을 지원하는 효율적이고 안전한 관행은 여전히 논의되고 있는 추세"라고 '책임 있는 AI 투명성 보고서'를 통해 밝혔다.