"초거대AI, 미지 영역 많아···과도한 에너지 소비 등 숙제"

8일 열린 'AI서밋 서울 2021'서 LG, 네이버 연구소장들 토의

컴퓨팅입력 :2021/12/08 17:18    수정: 2021/12/08 21:30

LG가 초거대AI를 적용해 신약개발 핵심 단계인 리드(Lead) 물질 발굴 기간을 기존 3년 6개월에서 8개월로 단축했다. 또 데이터와 에너지를 적게 소비하는 쪽에서 초거대AI의 대진전이 이뤄질 것이라는 전망이 나왔다.

'초거대AI의 현재와 미래'를 점검한 패널 토론이 MIT 테크놀로지 리뷰 한국판을 국내서 발간하는 DMK가 8일 주최한 ‘AI 서밋 서울 2021(AI Summit Seoul 2021)’ 행사에서 열렸다. 토론에는 하정우 네이버 AI랩 소장과 이문태 LG AI연구원 랩장 겸 일리노이대학교 교수가 패널로 참여하고 정두희 MIT테크놀로지리뷰 코리아 편집장 겸 한동대 교수가 좌장(모더레이터)을 맡았다.

정두희 MIT테크놀로지리뷰 코리아 편집장이 사회를 보고 있다.

패널들은 초거대AI가 장점이 많지만 아직 미지의 영역이 많이 있다고 지적했다. 하정우 네이버 소장은 초거대 AI 등장 배경에 대해 "정보 저장 공간이 굉장히 커지고, 데이터 사용량과 하드웨어 사용이 커졌기 때문"이라고 진단했다.또  이문태 LG 랩장은 초거대 AI의 유용성에 대해 "데이터가 많아지면서 이를 학습하기 위한 비용과 시간이 많이 들어가는데 초거대AI는 이를 덜어준다"면서 "초거대AI는 데이터가 적은 '퓨샷'으로, 즉 샘플 몇개만 보여줘도 된다"고 설명했다.

네이버와 LG가 초거대AI를 활용해 지향하는 바는 달랐다. LG는 전문가 이용을, 네이버는 일생활 활용에 초점을 뒀다. 이문태 LG랩장은 "우리는 바이오, 공장 등 각 산업 분야 전문가들이 이용하는 AI시스템을 지향한다. 백신 개발과 공장 수요 예측 등에 초거대 AI를 활용하고 있다"면서 "AI기술 적용으로 신약개발 핵심 단계인 리드(Lead) 물질 발굴 기간을 기존 3년 6개월에서 8개월로 단축했다"고 들려줬다. 이어 "5만건의 우수 리드 후보 물질을 도출하는 한편 직접 합성 및 검증을 통해 목표 효능 물질을 조기에 발굴했다. LG는 초거대 AI를 포함해 현재 딥러닝이 가지고 있는 근본적인 문제점을 극복하기 위한 연구를 지속적으로 할 계획"이라며 "내년에는 괄목할 만한 성과를 보여 줄 수 있을 것"으로 예상했다. 이날 이 랩장은 초거대AI의 기능 일부를 시연, 10문장 이상의 긴 문장을 1~2 문장으로 요약한 장면을 보여줬다.

이문태 LG AI연구원 랩장이 이야기를 하고 있다.
하정우 네이버 AI랩 소장이 이야기를 하고 있다.

하정우 네이버 AI랩 소장은 네이버가 보유한 초거대AI '하이퍼클로바'에 대해 설명했다. '하이퍼클로바'는 국내 기업 최초로 자체 개발한 초대규모 AI다. 이 분야 원조인 미국의 GPT-3가 몇년 전 공개 당시 1750억개(175B) 파라미터(parameter·매개변수)를 보유했는데 하이퍼클로바는 이보다 큰 204B 파라미터 규모를 자랑한다.

파라미터는 인간 뇌의 ‘시냅스’와 유사한 역할을 한다. 규모가 커질수록 AI 성능도 더 뛰어나다. 특히 '하이퍼클로바'는 GPT-3보다 한국어 데이터를 6500배 이상 학습했다. 이를 위해 네이버는 5600억 토큰(token·말뭉치)의 한국어 대용량 데이터를 구축했다. 이는 한국어 위키피디아의 2900배, 뉴스 50년치, 네이버 블로그 9년치에 달하는 규모다. 학습에는 300B 토큰을 사용했다.이 같은 초거대 AI를 개발하기 위해 네이버는 지난해 10월 700페타플롭(PF) 성능 슈퍼컴퓨터를 도입한 바 있다.

이날 네이버 초거대AI를 시연한 하 소장은 "완내스(완전 내 스타일) 같은 유행어는 물론 사투리도 인식한다"면서 "기획자 만족도가 99%에 달한다"고 들려줬다. 네이버는 '하이퍼클로바'를 홀로 사는 어르신들 안부를 묻는 용도로도 활용, 큰 성과를 내고 있다고 설명했다.

그럼 우리나라의 초거대AI 기술 수준은 얼마나 될까? 정두희 편집장의 이 같은 질문에 이문태 LG 랩장은 "오픈AI, MS, 구글 등 미국 빅테크들은 2018년전부터 시작했다. 시점은 우리가 늦었다"면서 "패러미터 경쟁을 하고 있지만 아직 초거대AI에 대해 모르는 부분이 많이 있다"며 우리도 톱수준에 올라설 가능성이 있음을 시사했다.

관련기사

초거대AI 이후 다음 화두는 무엇일까? 이에 대해 이문태 랩장은 "초거대AI에 대해 아직 모르는 것 많다. 잠재력은 무궁무진하다. 앞으로 상당 기간 연구가 이뤄질텐데 연구자만으로는 한계가 있다. 좋은 파트너들이 있어야 한다"면서 "우리는 초거대 AI 다음으로 메타버스를 보고 있다"고 밝혔다.

하정우 네이버 소장은 초거대AI가 주목과 함께 비판도 많이 받는다면서 "에너지를 너무 많이 쓰고, 모델 편향에 따른 신뢰 문제 등이 있다"면서 "앞으로 데이터와 에너지, 하드웨어를 적게 쓰는 방향으로 갈 거다. 이걸 어떻게 푸는냐가 브레이크 스루(대혁신)가 될 거다. 이질적인 도메인을 활용하는 것도 중요하다"고 내다봤다.  또 네이버의 초거대AI를 육수에 비유하며 "모두가 육수를 만들 필요는 없다. 우리랑 파트너를 맺으면 된다. 단 사내에 데이터잘 구축돼 있어야하고 어떤 문제를 풀어 어떤 가치를 만들 건지 고민하고 있어야 한다"고 덧붙였다.