[IITP 기술산책] 인간 영역 넘보는 초거대 AI

전문가 칼럼입력 :2022/12/26 22:25

임효주 정보통신기획평가원(IITP) 산업분석팀 선임

지난 2월, LG의 신입 디자이너가 뉴욕 패션위크에서 센세이션을 일으켰다. 그 신입 디자이너의 이름은 초거대 AI로 만든 가상인간 ‘틸다’다. '틸다'는 인간 디자이너와의 협업을 통해 '금성에 핀 꽃(Flowers on Venus)'을 주제로 의상 디자인을 창작하며 놀라움을 자아냈다. 인공지능은 어떻게 창작의 영역까지 넘어오게 된 걸까?

그동안 AI는 단일태스크 해결에 초점 맞춰

인공지능 출발은 ‘인간을 닮은 기계를 만들자’였다. 이전까지의 AI는 번역이면 번역, 이미지 분류면 이미지 분류, 이렇게 하나의 태스크(task) 해결에 초점을 맞췄고 인간 같은 복합지능을 구현하는 데에는 어려움이 있었다. 특히 창작은 인간 영역 중에서도 단순 지식을 넘어 예술적 감각을 요구하기 때문에 기존 인공지능으로는 돌파할 수 없는 한계가 있었다.

거대해지면 똑똑해진다고?

그러나 일론 머스크 등 실리콘밸리 주역들이 설립한 인공지능 전문 연구소 ‘오픈AI’는 불과 2년 전 GPT 시리즈의 3세대 모델을 발표하며 인간에 가까운, 어쩌면 창작도 가능한 인공지능 가능성을 암시했다. 비결은 모델 사이즈에 있었다. 2세대 모델인 GPT-2가 15억 개 파라미터를 가졌는데, GPT-3는 그 크기를 1750억 개로 대폭 키웠다. GPT-3는 이전 대비 116배 가량 커진 모델 사이즈로 기사, 이메일 쓰기부터 디자인, 코딩까지 여러 태스크를 해결하는 저력을 보이며 인공지능의 새로운 국면을 열었다.

실제 GPT-3는 '필요한 것은 사랑을 주고받고자 하는 마음뿐, 그 어떤 조건이나 기대 없이 완전히 사랑하려는 마음뿐입니다'는 러브레터까지 작성하며 그 능력을 입증해 보였다. 모델이 거대해지면 똑똑해진다는 인식이 퍼지며 업계에는 초거대 AI 열풍이 불기 시작했다. 기업들도 단일지능을 넘어 복합지능을 갖춘, 그래서 범용 인공지능(Artificial General Intelligence, AGI)에 한 발 가까워진 인공지능을 개발하기 위해 총력을 가하고 있다.

국내외서 쏟아지는 초거대 AI 모델

구글, 마이크로소프트, 메타는 물론 네이버, LG, 카카오 등 국내외 빅테크 기업이 초거대 모델들을 대거 발표했다. 시작은 언어 기반의 초거대 모델이었다. 인류가 문명을 만들고 지식을 창출한 기반이자 소통의 매개체가 언어였기 때문이다. 인간을 닮은 기계를 만들고자 자연어 분야에 뜨거운 관심이 쏟아졌고, 네이버의 하이퍼클로바와 구글의 람다(LaMDA)와 PaLM 모델도 이 과정에서 세상에 모습을 드러냈다.

언어를 넘어 다양한 감각으로 사고하는 초거대 멀티모달 AI

그러나 인간에 가까운, 복합지능을 구사하는 인공지능을 위해서는 언어를 넘어 이미지, 음성, 영상까지 처리할 수 있는 모델이 필요했고, 이는 멀티모달 AI 개발을 이끌었다. 멀티모달AI란 말 그대로 여러 개(multi)의 데이터 양식(modality)을 복합적으로 사용하는 모델이다. 텍스트, 음성, 영상, 이미지, 제스처, 시선, 표정 등 모델이 받아들일 수 있는 양식이 확장된 것이다.

오픈AI는 2021년, '달리(DALL-E)'를 선보이며 초거대 멀티모달 AI의 시작을 알렸다. 달리는 텍스트 명령을 받아 ‘아보카도 모양의 의자’처럼 세상에 존재하지 않는 그림을 만들어내는 생성능력까지 선보였다. 이에, 구글에서는 비디오 생성까지 가능한 이매진(Imagen)을 선보였고, 국내에서도 LG의 엑사원, 카카오의 민달리(minDALL-E)처럼 텍스트와 이미지를 동시에 처리하는 모델을 경쟁적으로 출시했다. 특히 '엑사원'은 디자이너 틸다를 탄생시키며 멀티모달 AI에 관한 기대감을 증폭시켰다.

신약 및 소재 개발에 이어 사회 난제 해결에 활용하는 초거대 AI

멀티모달 AI를 향한 기대감은 난제 해결의 가능성과 맞물리며 고조되고 있다. 기술 진보와 더불어 이제는 사회 난제 해결, 과학 탐사 지원 등에 기여할 것이라는 전망도 나온다. 실제로 구글 딥마인드가 복잡한 단백질 구조를 예측하는 '알파폴드(AlphaFold)'를 개발한 이후 LG와 카카오브레인도 신약개발에 초거대 AI를 활용하는 움직임을 보이고 있다. 특히 카카오브레인은 회사 자원의 절반을 헬스케어 부문에 투입하며 멀티모달 모델을 통해 신약 개발 기간을 단축하고 비용을 절약하겠다는 포부를 내비쳤다.

이제 초거대AI 무게를 덜어내야 할 때

향후 초거대 AI의 범용적 활용성과 함께 고려해야 할 또다른 점은 탄소 배출이다. 초거대 AI 운용에는 일반 서버 3000대를 사용하는 막대한 전력이 필요하다고 알려져 있다. 특히 인공지능 모델을 특정 산업과 태스크에 활용하기 위해서는 반복 학습이 필요한데, 매 학습마다 엄청난 양의 전력 사용과 함께 탄소 배출이 일어나는 것이다.

관련기사

실제로 GPT-3 훈련에는 190㎽의 전력이 사용되고, 이는 일반 가정 126채의 연간 소비량에 준하는 수준이다. 탄소 배출량으로 환산하면 85톤, 즉 자동차로 70만㎞의 거리를 이동할 때 발생하는 탄소가 배출된다. 이에, ESG 관점에서 경량화 모델에 대한 업계 관심도 커지고 있다. 기술 발전과 삶의 편의를 더 이상 환경과 분리해 생각할 수 없는 시기가 도래했기 때문이다. 이제는 거대해지면 똑똑해진다는 성능만 강조할 것이 아니라, 무게를 덜어내고 최소한의 크기로 최대의 효율을 낼 수 있는 모델을 만들어야 할 때가 아닐까 한다.

임효주 IITP 선임

'IITP 기술산책'은 국내 ICT 연구개발(R&D) 총괄기관인 정보통신기획평가원(IITP) 연구원들이 매월 쓰는 코너입니다

*본 칼럼 내용은 본지 편집방향과 다를 수 있습니다.