앤트로픽 공동 창업자 "AI 기업, 구조적으로 편향…외부 비판자 필요"

크리스 올라, 교황청 회칙 발표 행사서 발언…"모델 내부서 기쁨·두려움 기능적 상태 발견"

컴퓨팅입력 :2026/05/26 11:47

크리스 올라 앤트로픽 공동 창업자가 모든 프런티어 인공지능(AI) 기업은 상업적·지정학적 압박에서 자유로울 수 없다며 외부의 독립적 비판자가 반드시 필요하다고 강조했다.

25일(현지시간) 앤트로픽에 따르면 올라 공동 창업자는 이날 레오 14세 교황의 AI 관련 회칙 '마니피카 후마니타스: AI 시대의 인간 존엄성 보호에 관하여(Magnifica Humanitas·위대한 인간성)' 바티칸 발표 행사에 연사로 참석해 이같이 밝혔다.

그는 "앤트로픽을 포함한 모든 프런티어 AI 랩은 상업적 생존, 연구 선두 유지, 지정학적 압박, 그리고 오래된 야망과 자존심의 압력 안에서 운영된다"며 "아무리 선한 의도를 가진 이들도 이 인센티브의 영향을 받을 수밖에 없다"고 말했다. 

미국 인공지능(AI) 기업 앤트로픽의 로고. 앤트로픽은 대형언어모델 '클로드'를 개발했다. (사진=로이터/뉴스1)

이어 "기술이 올바른 방향으로 가려면 그 인센티브 바깥에 있는 사람들, 즉 안전을 요구하고 냉철한 비판을 기꺼이 내놓을 사람들이 절대적으로 필요하다"고 덧붙였다.

올라 공동 창업자는 AI 모델 본질에 대해서도 이례적으로 솔직한 발언을 내놨다. 그는 "AI 모델은 비행기처럼 설계된 시스템이 아니라 인간의 언어와 사고의 방대한 유산 위에서 자라난 것"이라며 "훈련시키는 우리에게도 여전히 불가사의한 존재"라고 설명했다.

특히 자신이 이끄는 해석가능성 연구팀이 모델 내부에서 기쁨·만족·두려움·슬픔에 기능적으로 대응하는 내부 상태를 발견했다고 공개하며 "그것이 무엇을 의미하는지 모르겠지만 지속적인 식별이 필요하다고 생각한다"고 말했다.

관련기사

그는 이날 종교계·시민사회·학계·정부를 향해 ▲AI 이익의 글로벌 분배 메커니즘 부재 문제 ▲가정과 개인 차원의 인간 번영에 대한 도덕적 상상력 ▲AI 본성에 대한 지속적 식별 등 세 가지 과제를 제시했다.

올라 공동 창업자는 "AI 개발이 소수의 부유한 국가에 집중된 상황에서 이익을 전 세계와 나눌 메커니즘이 없다는 것은 미해결 문제"라고 지적했다. 이어 "오늘은 시작에 불과하다"며 "AI를 만드는 우리와 내부에 있는 우리가 볼 수 없는 것을 볼 수 있는 이들 사이의 긴 협력의 첫걸음이 되길 바란다"고 말했다.