국내외 빅테크 기업들의 초거대AI 선점 경쟁이 뜨겁다. 초거대AI는 슈퍼컴퓨터급의 대용량 하드웨어에 AI기술을 적용한 'AI 슈퍼컴퓨터'를 말한다. AI가 학습한 데이터가 저장되는 곳인 파라미터(매개변수)가 보통 1조개가 넘는다. 파라미터는 사람 뇌에서 정보를 학습하고 기억하는 시냅스와 비슷한 역할을 한다.
초거대AI 경쟁을 촉발한 것은 오픈AI가 2020년 5월 내놓은 'GPT-3'로 언어처리에 특화한 범용AI다. 1750억개 파라미터와 3000억개 데이터셋으로 사전학습을 했다. 오픈AI에 이어 구글은 지난 2월 파라미터 수가 최대 1조6000억개에 달하는 초거대 AI '스위치 트랜스포머'를 공개했고, 마이크로소프트(MS)와 엔비디아는 지난해 10월 파라미터 5300억개 규모의 언어 모델 'MT-NLG'를 선보였다.
국내 빅테크들도 잇달아 초거대AI 구축 경쟁에 뛰어들었다. 가장 먼저 뛰어든 곳은 네이버다. 네이버는 지난해 5월 한국어에 최적화한 2040억개 파라미터 규모의 초거대AI '하이퍼 클로바'를 발표했다. 같은 해 12월에는 LG가 3000억개 파라미터의 '엑사원'이라는 초거대AI를 선보였다. LG는 '엑사원' 파라미터 수를 6000억개로 늘리고, 조 단위도 계획중이다. 카카오도 지난해 11월 한국어 특화 언어AI인 'KoGPT'를 선보였다. 통신사들도 적극 나서 SK텔레콤이 지난 5월 GPT-3를 기반으로 한 한국어 특화 자체 모델을 개발했고, KT는 한국전자통신연구원(ETRI) 등과 손잡고 연내 초거대 AI를 내놓을 예정이다.
초거대AI는 그동안 우리 삶을 어떻게 변화시켰고 또 앞으로 어떤 변화를 초래할까. 이를 들을 수 있는 장이 15일 오후 서울 코엑스 1층 B홀에 마련된다. 국내 1호 초거대AI 기업인 네이버에서 초거대AI를 담당하고 있는 성낙호 클로바CIC 책임리더가 이날 오후 열리는 '테크퓨처' 컨퍼런스에서 초거대AI를 주제로 강연을 한다. 이 행사는 지디넷코리아가 한국SW산업협회, 한국정보통신방송대연합(ICT대연합), 디지털헬스케어연합포럼과 공동으로 주최 및 주관했다.
15일 강연에 앞서 지디넷코리아와 사전 인터뷰를 한 성낙호 책임리더는 "AI를 고도화하는 방법론은 대충 잡혔다"면서 "AI로 뭘 할 수 있는 걸 생각할 수 있는 단계가 됐고, 지금 AI팀을 잘 못 꾸리면 낭패를 볼 수도 있다"고 진단했다.
성 책임리더는 서울과학고를 거쳐 서울대에서 컴퓨터 공학을 전공했다. 고등학교때부터 자율주행차 등 AI에 관심이 많았고, 대학 졸업 후 헥스플렉스를 창업해 게임엔진을 개발한 경험이 있다. 레드덕을 거쳐 엔씨소프트 등 게임업계에서 18년을 일했다. 엔씨소프트에 있을때 세계 최초로 언리얼엔진3(UnrealEngine3)를 활용한 멀티플레이어 온라인 게임을 개발하기도 했다. 2017년 6월부터 네이버 책임리더로 일하고 있다. 아래는 성낙호 책임리더와 일문일답.
-직책이 네이버 클로바 CIC의 책임리더다. 책임리더는 어떤 역할을 하는 건가
"CIC는 컴퍼니 인 컴퍼니(CIC)로 네이버안에서 독립회사처럼 운영하는 단위다. 네이버는 2015년부터 CIC 제를 운영하고 있다. 내가 속한 클로바 CIC 외에 서치CIC 등 8개 CIC가 있다. 책임리더는 일반 기업의 상무급 임원이다. 네이버가 직급 체계가 단순하다. C레벨 경영 리더가 있고, 이 아래 CIC 대표, 이 아래 책임리더가 있다. 책임리더 아래에는 리더와 평직원이 있다. 책임 리더는 네이버 전체적으로 100여명 정도 될 것 같다."
-클로바 CIC는 어떤 일을 하나. 조직 구성은?
"AI가 전화 받아 주는 AI콜과 AI로 독거 어르신들을 돌보는 케어콜 사업 등을 한다. 네이버 스마트 스토어에 들어가는 AI기술도 담당하고 있다. 하이퍼 클로바라는 초거대 AI도 내가 맡고 있다. 수년 안에 사용할 AI에 집중한다. 반면 AI랩은 보다 긴 시간을 갖고 리서치를 한다. 직원은 클로바 CIC 전체적으로 수백명 된다. 협업하는 업무가 많다."
-네이버가 초거대AI를 만든 이유는?
"네이버가 프러덕트(서비스)가 많다. 이전에는 프러덕트마다 AI인원을 배치, AI인원이 분산됐다. 우리(네이버)도 만족 못하고, 고객도 만족하지 못했다. 이 방식으로는 지속가능하지 않겠다고 생각하던 중 GPT3가 나왔고, 이 것이 해답이 될 수 있을 것 같았다. 그래서 GPT3 이후 세계적으로 빠르게 네이버도 초거대AI를 내놓았다. 현업에서 800억개 정도 파라미터를 쓰고 있고, 2000억개 넘는 걸 테스트하고 있다. 서비스에 사용하려면 비용 문제가 발생해 (AI모델) 경량화에 힘쓰고 있다. 파라미터 수를 줄이면서도 오히려 성능은 더 좋은 AI 개발에 주력하고 있다. AI 성능을 가르는 주요 기준인 파라미터는 신경망 박스 안에 있는 일종의 '기록 메모리'다. 램(RAM)과 다른 건 램은 그냥 들어오는대로 나간다. 반면 파라미터는 한번 소화를 한 후 결과를 밖으로 내보낸다."
-초거대AI로 그동안 어떤 성과가 있었나
"그동안 '하이퍼클로바'는 검색, 쇼핑 등 네이버의 대표 서비스에 적용, 사용자들에게 향상된 서비스 경험을 제공했다. 우리가 기대하는 건, 기존에 안되는 걸 되게 하는 게 아니다. 원래 AI로 할 수 있는 걸 AI엔지니어나 AI데이터가 없어 못하던 게 많았다. 이걸 하자고 만든게 '하이퍼클로바'다. 물론 기존에 못하던 걸 '하이퍼 클로바' 덕분에 하게 된 것도 있다. 독거 어르신들을 위한 'AI 케어콜 서비스'가 그렇다. 'AI 케어콜 서비스'를 시장에 내놓은 지 꽤 됐는데, 사용자들이 고맙다고들 한다. 'AI 케어콜 서비스'는 한단계 진화한 AI서비스다. 세계에도 이런 서비스는 없다. 특히 우리가 클라우드로 제공하는 '클로바 스튜디오'는 스타트업, 대학 등 외부 파트너 누구나 AI를 만들 수 있게 해주는 SW 도구다. 앞으로 소상공인, 창작자 등 보다 많은 사람들이 '하이퍼 클로바'를 활용할 수 있게 지원할 계획이다."
-'클로바 스튜디오'는 AI 대중화에 기여할 것 같다. 어떤 툴인지 좀 더 이야기 해달라
"노코드(no-code) 인공지능(AI) 플랫폼이다. 노코드는 코딩 없이 음성이나 클릭 등 직관적인 입력으로 앱이나 프로그램을 만들 수 있게 해주는 기술이다. 최근 사용자가 원하는 언어모델을 만들 수 있는 '튜닝' 기능을 추가했다. 새로 추가한 '튜닝' 기능은 사용자 데이터를 학습한 후 '하이퍼클로바' 언어모델 파라미터
일부를 과제 종류나 언어, 데이터 등에 맞게 최적화해 활용하게 해준다. 사업하는 분, 기획하는 분, 문과생도 AI를 마음대로 가져다가 사용할 수 있게 해준다."
-세계적으로 초거대AI 선점경쟁이 일고 있다. 초거대AI는 왜 중요하나
"우선 AI주권을 말하고 싶다. 인터넷상에 존재하는 언어는 영어가 60%다. 한국어는 0.6% 밖에 안된다. 미국 GPT-3가 학습할 때 사용한 언어는 영어는 93%다. 반면 한국어는 0.02%밖에 안됐다. 우리가 생각하는 지적 활동은 다 언어로 기록된다. 만일 이 것이 올라가면 우리의 지적 활동에 대한 생산성도 올라갈 수 있다. 이처럼 AI는 생산성 향상의 도구인데, AI가 영어만 잘알고 활용하면 그만큼 우리나라 생산성은 뒤쳐진다. 그래서 우리나라도 여러 기업이 초거대AI를 내놔야 한다고 생각했고, 다른 사람들이 이를 사용하도록 우리 플랫폼을 열어 놨다. AI가 계속 발전할 텐데 이 흐름에서 한국이 뒤지면 안된다. 과거 IT붐때 한국에서 싸이월드도 만들고 여러 좋은 서비스를 만들었지만 결국 지금은 페이스북이 다 장악했다. 이런 과거를 다시 밟아선 안된다. 우리나라 사람들은 서비스를 빠르게 잘 만든다. 이번에 초거대AI를 개방함으로써 페이스북 같은 서비스가 나오지 않을까 기대하고 있다."
-초거대AI에 대해 낭비라는 시각도 있는데...
"지금 각광받고 있는 '버트'도 처음 나올때 그랬다. 버트도 처음 나왔을때, 그렇게 큰 거 어디다 쓰냐고 했다. 비판의 기준이 잘 못 된 것 같다. 이해를 기반으로 한 추론이 너무 비싸다고 하는데, 그럼 추론은 뭘로 하나. 사람들이 쓰면 가치가 생긴다. 이런 걸 만들어내는게 중요하다"
-오는 15일 강연에서는 어떤 내용을 들려주나
"AI를 고도화하는 방법론은 대충 잡힌 것 같다. AI로 뭘 할 수 있는 걸 생각할 수 있는 단계가 됐고, 이걸 하기 위한 실천 전략들을 말하려 한다. 기술 과 환경 변화가 빨라 지금 알고 있는게 무효화 할 가능성이 높다. 지금 AI팀을 잘 못 꾸리면 낭패를 볼 수 있다. 2~3년 후를 생각한다면 내 이야기를 듣는게 좋을 것 같다."
-정부가 AI강국을 선언하고 다양한 정책을 시행하고 있다. AI강국에 대해 조언을 한다면
"요즘 AI를 이렇게 말하곤 한다. 데이터가 인텔리전스 되는 거라고. 학습에 들어간 데이터를 통달하고 나면 알 수 있는 게 있는데, 이걸 지능이라고 한다면, 이걸 뽑는게 아티피셜 인텔리전스(Artificial Intelligence)다. 최근 깃업에서 '코파일럿'이라고 하는 코딩을 대신해 주는 게 올라왔는데, 코드를 잘 짜줘 코딩하는 사람들이 많이 쓴다. 채택률이 반이나 되는데, 이정도만 돼도 개발 생산성이 올라간다고들 한다. 이런 AI를 코딩이 아닌 수학이나 물리에 넣으면 어떻게 되겠나. 작년만 해도 불가능했다고 생각한게 올해 되는게 많다. 우리가 풀고 싶은 도메인 데이터가 뭔지 정의(디파인)하고, 이를 해결하는 AI를 만들면 우리나라도 경쟁력이 있다고 본다. 전체를 아우르는 AI를 만드는게 최강이겠지만 이는 파라미터가 너무 많이 드는 단점이 있다. 우리나라가 특화하고 집중하는 전략을 취하면 세계적 수준이 못될 것도 없다. 물론 내 생각이 다른 사람과 다를 수도 있다. 내가 보기에는 AI기술은 쓸만한 수준으로 넘어왔다. 하이프(거품)를 이야기할 단계가 아니다. 이걸 어떻게 쓸 지를 고민해야 한다. 그런데 학교에서는 이걸 가르칠 분이 없다. AI하면 AI 이론 자체만 배우는 경우가 많다. 이는 AI를 위한 AI다. 이보다는 AI서비스를 위한 AI를 이야기 해야한다. 이게 AI강국이다. 뭔가 잘못 잡힌 거 아닌가 한다. AI서비스를 위한 AI를 해야 한다. 이런 부분이 적어 아쉽다."