전 세계 교육 시스템이 AI 도입을 두고 기로에 서 있다. 경제협력개발기구(OECD)가 발표한 리포트에 따르면, AI는 개인 맞춤형 학습으로 교육 격차를 해소할 수 있다는 희망과 함께 학생들의 사고력을 퇴화시키고 프라이버시를 침해할 수 있다는 우려를 동시에 낳고 있다.

챗GPT 등장 후 교육계 변화... 사교육 시장에서 가장 빠르게 확산

2022년 챗GPT가 등장한 이후 전 세계 교육계는 급격한 변화를 겪고 있다. OECD 교수학습 국제조사(TALIS) 2024에 따르면, OECD 국가 교사의 37%가 지난 12개월간 AI를 교육에 활용했다고 답했다. AI 관련 연수 참여율은 OECD 평균 38%였으며, 싱가포르는 75%로 가장 높았고, 한국과 카자흐스탄, 아랍에미리트에서는 60% 이상의 교사가 AI 관련 연수를 받았다.

교사들은 AI를 주로 수업 주제 요약(68%)과 수업 계획 작성(64%)에 활용했다. 또한 25%는 학생 참여도나 성취도 데이터 검토에, 26%는 학생 과제 평가나 채점에 AI를 사용했다. 특히 52%의 교사가 AI가 특수 교육이 필요한 학생을 지원하는 데 도움이 된다고 답했다. 하지만 우려도 크다. OECD 평균으로 교사의 72%는 AI가 학생들의 표절을 조장할 수 있다고 답했고, 42%는 AI가 편향성을 증폭시킬 수 있다고 우려했다.

더 주목할 점은 학생들이 교실보다 집에서 AI를 더 많이 사용한다는 것이다. 스위스 조사에 따르면 초등학생의 8%, 중학생의 30%, 일반 고등학생의 50%가 교실에서 AI를 정기적으로 사용한 반면, 가정에서의 학습 관련 AI 사용률은 각각 9%, 33%, 54%로 더 높았다. 이는 AI 교육이 학교보다는 가정, 특히 사교육 시장에서 먼저 확산되고 있음을 시사한다.

AI 튜터의 양면성: 학습 향상 vs 인지적 외주화

AI 튜터와 교육 보조 시스템의 효과에 대한 연구 결과는 엇갈린다. 터키에서 실시된 무작위 대조 실험(RCT)에서 839명의 중등학교 학생을 대상으로 한 수학 성적 연구는 흥미로운 결과를 보여주었다. 일반 챗GPT에 접근한 학생들은 대조군 대비 평균 48%의 성적 향상을 보였다. 더 놀라운 것은 교사의 입력과 모범 사례로 훈련된 특화 버전 챗GPT 튜터를 사용한 학생들이 127%의 성적 향상을 달성했다는 점이다.

그러나 사후 테스트(AI 도움 없이)에서 특화 버전 사용 학생과 대조군 간 성적 차이가 유의미하지 않았던 반면, 일반 챗GPT 사용 학생들의 성적은 17% 하락했다. 이는 적절한 안전장치 없는 AI 도구가 학생의 학습 성과를 저하시킬 수 있음을 시사한다.

미국 유타주에서 166,000명 이상의 학생을 대상으로 한 대규모 RCT는 5가지 적응형 AI 읽기 소프트웨어의 효과를 검증했다. 결과는 취학 전 아동의 읽기 점수에서 큰 긍정적 효과를 보였으며, 초등학생에게서도 중소 규모의 효과가 관찰됐다. 특히 영어 학습자, 저소득층, 특수교육 대상 학생 등 취약 계층이 가장 큰 혜택을 받았다.

그러나 대만에서 153명의 고등학생을 대상으로 한 프로그래밍 수업 RCT는 상반된 결과를 보여주었다. 챗GPT를 사용한 실험군 학생들은 전통적 강의식 교육을 받은 대조군에 비해 자기효능감과 학습 성취도가 낮았다. 이는 챗GPT가 프로그래밍 교육에서 최소한이거나 부정적인 영향을 미칠 수 있음을 시사한다.

수학 성별 격차, AI가 해법이 될 수 있을까

이탈리아는 PISA 2022에서 수학 성별 격차가 가장 큰 국가로 나타났다. 국가 평가 결과 이탈리아 여학생들은 이미 2학년 때부터 남학생에 비해 수학 성적이 낮았다.

OECD 리포트는 AI가 이러한 격차 해소에 기여할 수 있는 여러 방안을 제시했다. AI 기반 멘토링 시스템은 여학생들을 관련성 있는 여성 STEM(Science, technology, engineering, and mathematics) 멘토와 연결해 롤모델을 제공할 수 있다. 미국의 초기 교실 실험에서는 저명한 여성 수학자와의 대화를 시뮬레이션하는 AI 기반 '롤모델 에이전트'가 평가자가 아닌 동반자로 제시될 때 여학생들의 수학에 대한 소속감을 높이는 것으로 나타났다.

AI는 또한 성 고정관념이 배제된 개인 맞춤형 학습 환경을 제공할 수 있다. 교사의 무의식적 편향이 여학생의 수학 성취에 부정적 영향을 미칠 수 있는데, AI 튜터는 이러한 편향으로부터 자유로운 피드백과 지원을 제공할 수 있다. 하지만 주의해야 할 점은 AI 시스템 자체가 훈련 데이터에 내재된 편향을 반영할 수 있다는 것이다. 영어권 수학 교과서를 중심으로 훈련된 AI는 소수 집단 학생을 소외시키거나 참여를 저해하는 서사를 포함할 수 있다.

국가 AI 교육 전략의 핵심 원칙 다섯가지

OECD는 교육 시스템에 AI를 구현할 때 고려해야 할 몇 가지 핵심 원칙을 제시했다.

첫째, 의도성과 교육학적 정렬이다. AI는 목적이 아니라 수단이며, 그 배치는 명확히 표현된 교육 목표와 명시적으로 연결되어야 한다. 도구는 정책 입안자와 교육자가 육성하려는 지식, 기술 또는 성향, 성공을 판단할 지표, 필요한 보완적 인적 투입을 명시한 후 선택(또는 거부)되어야 한다.

둘째, 예방 원칙이다. 더 낮은 안전 위험을 가진 단순한 기술이 AI 도구와 비슷한 학습 목표를 달성할 수 있다면 그것을 선호해야 한다. 이는 완전한 정보에 입각한 동의를 할 수 없는 미성년자가 교육 현장에서 AI 도구의 사용자라는 점을 고려할 때 특히 중요하다. 단계적 도입은 예방의 실질적 표현이 될 수 있다. AI 튜터링은 핵심 과목에 통합되기 전에 선택적 보충 세션에 예약될 수 있고, 학교 환경에서 일일 사용 시간이 제한될 수 있으며, 라이선스 갱신 전에 독립적인 효과성 검토가 의무화될 수 있다.

셋째, 교육자의 감독이다. 개인화가 무조건적인 선이 아니다. 인간은 "인지적 구두쇠"로, 지름길이 나타날 때마다 기꺼이 노력을 외주화하는 경향이 있다. 그 결과 많은 이들이 프로그램이 이미 단순화한 작업을 해결할 수 있다는 잘못된 숙달감을 발달시킬 수 있다. 정책 입안자가 배치에 대한 강력한 감독을 구축하지 않으면, 이러한 안일함은 학생들이 훈련 매개변수를 벗어나는 상황에 직면할 때만 식별될 것이다.

넷째, 형평성 고려사항이다. AI 기반 개인화는 참여와 반응성을 향상시킬 수 있지만, 증거는 또한 디지털 도구와 유료 기능에 대한 불평등한 접근이 기존의 사회경제적 격차를 심화시킬 수 있음을 나타낸다. 인간의 중재는 AI 출력을 해석하고, 학습을 맥락화하며, 기술이 계층화가 아닌 포용적 목적을 달성하도록 보장하는 데 필수적이다.

다섯째, 데이터 보호와 거버넌스다. AI 튜터는 순간순간의 참여, 감정, 성과 신호를 포착할 때 가장 잘 작동하는데, 이는 정의상 개인적이고 민감한 데이터다. 미성년자의 경우 동의는 규제 프레임워크를 형식적으로 준수할 뿐만 아니라 의미가 있어야 한다. 기술을 불신하거나 자녀의 디지털 발자국을 최소화하기를 원하는 가족은 학업적 불이익이나 학습 옵션에 대한 접근 제한 없이 실행 가능한 거부권을 가져야 한다.

FAQ (※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

Q1. AI 튜터가 사교육을 대체할 수 있나요?

A1. 조건부로 가능합니다. 터키 실험에서 교사 지도로 설계된 AI 튜터는 학생 성적을 127% 향상시켰지만, 일반 챗GPT는 오히려 17% 하락시켰습니다. 공교육에서 제대로 설계된 AI 튜터를 제공한다면 사교육 격차를 줄일 수 있지만, 상업용 AI 도구에 무분별하게 의존하면 위험합니다.

Q2. AI 사용이 학생들의 사고력을 퇴화시킬 수 있나요?

A2. 그렇습니다. AI에 과도하게 의존하면 스스로 사고하고 문제를 해결하는 능력이 약화되는 '인지적 외주화' 현상이 발생합니다. 대만 프로그래밍 실험에서 챗GPT 사용 학생들의 학습 성취도가 오히려 낮아진 것이 이를 증명합니다. AI는 기본 사고력을 갖춘 후 보조 도구로만 활용해야 합니다.

Q3. AI 교육 도구 사용 시 학생 데이터는 안전한가요?

A3. 현재로서는 우려가 큽니다. AI는 학생의 학습 패턴, 감정 상태 등 민감한 개인 정보를 실시간으로 수집합니다. EU는 AI법으로 교육을 "고위험" 영역으로 분류해 엄격히 규제하지만, 많은 국가에서 규제가 부족합니다. 학교의 AI 도입 시 강력한 데이터 보호 조치와 학부모의 거부권 보장이 필수입니다.

■ 이 기사는 AI 전문 매체 ‘AI 매터스’와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)