"구글도 AI 사업 성과 아직…한국 기업 승산 있어"

[북터뷰] 네이버 클라우드 하정우 AI혁신센터장

컴퓨팅입력 :2023/08/18 09:21    수정: 2023/08/19 12:50

네이버는 한국어 초거대 인공지능(AI) 모델 '하이퍼클로바X'를 이달 24일 공개한다. 바로 다음 주다. 현재 국내 경쟁사를 비롯한 산학계는 모델 기능과 서비스에 높은 관심을 두고 있다.

한국 밖은 더 치열하다. 미국, 중국 등 글로벌 빅테크는 서로 앞다퉈 거대언어모델(LLM)을 내놓는 추세다. 이를 활용한 서비스도 줄줄이 출시하고, 상상을 초월하는 자금 투자도 거침없이 진행한다.

하정우 네이버 클라우드 AI혁신센터장은 최근 본지와 인터뷰에서 현시점을 'AI 전쟁' 상황이라고 칭했다. 지난달 출간한 책 이름도 'AI 전쟁: 글로벌 인공지능 시대 한국의 미래'다. 글로벌 AI 전쟁 시대에 한국 기업이 어떻게 살아남을 수 있는지에 대한 내용이다. 한국도 AI 전쟁에서 이길 수 있다는 희망적인 메시지가 담겼다. 이를 위한 과제도 많이 제시했다.

네이버 클라우드 하정우 AI혁신센터장. (사진=지디넷코리아)

하정우 AI혁신센터장은 한상기 테크프론티어 대표와 책을 공동 집필했다. 한상기 대표가 질문하고, 하정우 센터장이 답하는 형태다.

책 집필은 한상기 대표가 하정우 센터장에 먼저 제안했다. 그가 하 센터장을 공동 저자로 꼽은 이유는 확고했다. 책 목차는 AI 기술, 산업, 정책 등 6장으로 이뤄졌다. 저자는 이 모든 분야를 빼곡히 알아야 했다. AI 연구를 활발히 진행하고, AI 기업에서 일하며, 정부와 직접 소통하는 AI 전문가여야 했다. 한 대표는 이 모든 스펙트럼에 들어갈 수 있는 사람을 하 센터장이라 생각한 셈이다.

책 표지 사진. (사진=교보문고 홈페이지 캡처)

"美 빅테크, AI 기술 앞섰지만 사업 성과는 아직”

하정우 센터장은 "구글 등 미국 빅테크가 다른 나라 기업보다 앞선 AI 기술을 가진 건 사실"이라고 말했다. AI 관련 논문을 가장 많이 냈고, 그중 전 세계 AI 판을 완전히 뒤집는 논문도 상당수라는 이유에서다.

하 센터장은 "AI는 기술에서 그치면 안 된다"며 "AI는 실제 비즈니스 모델로 이어져 새 가치를 만들 수 있어야 진짜다"고 강조했다. AI가 다양한 산업 분야에 스며들고 획기적인 수익을 창출할 수 있어야 시장에서 의미 있다는 말이다. 그는 "결국 AI로 돈을 벌 수 있느냐가 관건인데, 이 문제를 미국 빅테크도 아직 풀지 못했다"고 주장했다.

하정우 AI센터장은 AI로 비즈니스 획기적인 성과를 내는 기업은 아직 없다고 말했다. (사진=지디넷코리아)

하정우 센터장은 미국 기업의 AI 비즈니스 성과를 근거로 들었다. 그는 "오픈AI도 올해 5월 한국을 찾았을 때 킬러 애플리케이션을 찾지 못했다는 발언을 했다"고 말했다. 구글도 마찬가지다. 그는 "구글이 자사 서비스에 LLM '팜 2'를 제공한다고 발표했다"며 "이는 완전한 혁신이라 볼 수 없다"고 했다.

또 "마이크로소프트 빙 챗도 생각보다 트래픽을 획기적으로 늘리지 못했다"며 "구글 검색 독점은 여전하다는 게 이유"라고 했다. 하 센터장은 마이크로소프트 코파일럿도 혁신적인 성과 수치를 아직 제시하지 않았다고 덧붙였다. 결과적으로 미국 빅테크도 AI를 통한 획기적인 비즈니스 혁신을 이루지 못했다는 의미다.

하 센터장은 "과연 어느 나라, 어느 기업이 AI로 혁신을 이룰지에 대한 의문은 끝나지 않았다"며 "지금부터 누가 의미 있는 결과를 성공적으로 만들어 내느냐가 AI 전쟁 관건이다"고 강조했다.

“국내 기업, '퍼스트 무버' 조짐 보여”

하정우 AI혁신센터장은 "한국 기업은 미국, 중국과 비교했을 때 '패스트 팔로워(빠른 모방자)'에 가깝다"고 했다. 그러나 일부 '퍼스트 무버(선도자)' 조짐도 보인다고 말했다.

한국 기업이 세계에서 처음 개발한 AI 모델·기술이 등장하는 추세라는 이유에서다. 학계가 아닌 기업이 국제 학회에 논문도 꾸준히 게재하고 있다는 점도 강조했다.

하정우 센터장은 네이버 '케어콜'을 퍼스트 무버 예시로 들었다. (사진=지디넷코리아)

다른 국가에 없는 성과도 만들었다. 하정우 센터장은 네이버 '케어콜' 서비스를 예로 들었다. 그는 "노인 돌봄 등 사회 이슈 해결에 초거대 AI 기술을 활용했다"며 "기존 챗봇 시스템으로는 어떤 국가, 기업도 상상하지 못한 걸 했다"고 강조했다. 하 센터장은 "이러한 AI 혁신 사례를 꾸준히 만드는 것이 기업과 국가 경쟁력을 올리는 길이다"고 말했다.

또 다른 이유는 AI 모델 데이터 학습법이다. AI 모델 보유 기업은 모델을 여러 나라에 수출해 비즈니스 경쟁력을 올려야 한다. 이를 위해 AI 모델은 다양한 언어 데이터를 똑똑하게 훈련, 학습해야 한다.

네이버는 하이퍼클로바X를 수출할 계획이다. 현재 모델은 한국어, 영어, 제3외국어 데이터를 함께 사전학습(프리 트레이닝)한 상태다. 프리 트레이닝한 모델은 어느 시장에 내놔도 맞춤형 서비스를 출시할 수 있다. 서비스 목적에 맞게 파인튜닝만 살짝 진행하면 돼서다.

하 센터장 설명에 따르면, 네이버는 슈퍼컴퓨터를 직접 구입해 하이퍼클로바X 데이터 전체를 프리 트레이닝했다. 그는 "세상은 초거대 AI를 가진 기업과 가지지 않는 기업으로 나뉜다"며 "사실 모든 데이터를 프리 트레이닝을 할 수 있는 기업과, 그렇지 않은 기업으로 나뉜다가 정확한 표현이다"고 강조했다.

지난달 스탠퍼드대 앤드류 응 교수가 네이버 사옥을 찾았다. 당시 하정우 센터장은 "네이버 모델 데이터를 전체적으로 프리 트레이닝했다고 말했더니, 그가 상당히 놀랐다"고 말했다. 하 센터장은 "데이터 전체를 프리 트레이닝한 기업·연구소는 전 세계 20곳도 안 된다"며 "한국은 네이버뿐이다"고 강조했다.

다음 주 나올 '하이퍼클로바X' 핵심 서비스는

그는 다음 주 출시할 하이퍼클로바X 핵심 애플리케이션에 대해 언급했다. 그는 "네이버 자체 서비스인 쇼핑, 블로그, 예약 등에 생성 AI를 접목해 내놓을 방침"이라고 설명했다. 예를 들어, 네이버 쇼핑 판매자는 마케팅용 이미지 제작에 생성 AI 도구를 이용할 수 있다. 생성 AI는 블로거에게 글쓰기 도구를 제공한다.

하 센터장은 장기적으로 네이버 웨일 스페이스에 교육 시스템을 연결하는 방식도 구상 중이라고 했다. "생성 AI 기반으로 교육 콘텐츠를 제공하고, 경우에 따라 디지털 교과서를 연결할 수 있다"고도 덧붙였다.

다음 주 '하이퍼클로바X'가 나온다. (사진=지디넷코리아)

물론 네이버가 하이퍼클로바X로 모든 서비스를 제공할 순 없다. 그는 챗GPT 플러그인 처럼 여러 도메인과 연계할 의지도 보였다. 하 센터장은 "네이버에 없는 서비스를 가진 기업과 파트너십을 맺을 것"이라며 "서로 AI 생태계 내에서 상생하는 시너지 효과를 얻을 수 있을 것"이라고 말했다.

지금까지 네이버는 B2C(기업간소비자거래) 사업에 주력했다. 앞으로 B2B(기업간거래)에도 집중할 방침도 알렸다. 다만 생성 AI에 기업 전문 데이터를 활용하면 문제가 발생한다. 환각 현상이다.

하 센터장은 이를 방지하기 위해 내부적으로 전략을 구상했다는 입장이다. 그는 "파트너 기업은 상당한 문서와 데이터를 갖고 있다"며 "모델이 전문 데이터를 추가 학습할 수 있는 파이프라인을 통째로 제공할 것"이라고 했다.

일반적으로 챗GPT 등에 전문적인 지식을 질문하면 환각 현상 확률이 높아진다. 전문 데이터를 학습하지 못해서다. 네이버는 이런 현상을 미연에 방지하기 위해 전문 데이터 학습 파이프라인을 제공하는 셈이다.

그는 "파트너 기업은 이를 통해 환각 현상을 줄이고 업무 생산성을 올릴 수 있다"며 "네이버는 비즈니스적으로 B2B 포트폴리오까지 쌓을 수 있다"고 설명했다.

"국산 AI 반도체 개발·데이터 가공은 필수"

그는 AI를 다양한 비즈니스에 접목하려면 에너지 효율도 중요하다는 입장이다. 하 센터장 설명에 따르면, 현재 가장 효율 높은 AI 반도체를 만드는 것도 중요하다. AI 전쟁에서 승리할 수 있는 길이어서다.

책에서 네이버는 지난해 삼성전자와 손잡고 AI 반도체 제작을 시작했다고 나왔다. 그는 삼성전자와 협력한 이유를 AI 주권으로 꼽았다. 하 센터장은 "앞으로 LLM 적용한 비즈니스가 크게 성장할 건데, 여기에 최적화된 AI 반도체를 국내 기술로 만들면 좋겠다는 생각에 협력했다"고 말했다.

그는 삼성전자와 협력한 이유를 설명했다. (사진=지디넷코리아)

AI 시대에 네이버와 삼성이 서로 원하는 걸 갖고 있다는 점도 꼽았다. 하 센터장은 "삼성은 반도체 설계를 할 수 있고 파운더리가 있지만, AI 칩을 서비스에 적용했을 때 트래픽, 연산 병목현상 정보를 알 수 없다"고 했다. "반면 네이버는 서비스 적용 시 나타나는 정보, 반도체 제작을 위한 소프트웨어 구상엔 능숙하지만, 파운더리나 칩 설계 경험은 적다"고 설명했다.

그는 앞으로 AI 인퍼런스 반도체가 더 중요해질 것으로 내다봤다. 서비스 사용자가 늘어나면, 서비스 자체도 커진다. 그럼 GPU도 늘려야 하고, 비용도 덩달아 커진다. 그는 "이러한 비용 증가 속도를 줄일 수 있는 건 AI 인퍼런스 반도체뿐"이라는 주장이다. 그는 "이 반도체를 통해 전력 효율을 높이고 모델 크기를 작게 만드는 게 중요하다"며 "가급적이면 국내 기업이 잘 만들어서 글로벌 진출하는 게 좋을 것"이라고 밝혔다.

하정우 AI혁신센터장은 데이터 가공을 통한 에너지 효율 개선도 필수라고 했다. 데이터 가공을 통해 좋은 데이터 소스만 남기고, 중복 소스는 지우는 식이다. 그는 "같은 단어도 어떤 데이터에서 나왔느냐에 따라 품질 자체가 다르다"며 "관련 논문도 지속적으로 느는 추세다"고 말했다.

그는 "프리 트레이닝 데이터를 얼마나 최적화해서 잘 구축하느냐가 중요하다"며 "네이버도 신경 쓰고 있는 부분이다"고 했다. 또 파인튜닝을 할 때도 가급적이면 데이터를 덜 쓰게 하는 방안도 찾아야 한다고 했다.

"정부출연연구기관, 기업 힘든 부분 도와야"

그는 정부가 AI 기업 힘든 부분을 적극 도와야 한다고 했다. (사진=지디넷코리아)

하정우 센터장은 정부출연연구기관(출연연) 지원 방식도 변해야 한다고 제안했다. 기업이 하기 힘든 부분을 출연연이 도와주면 된다고 했다.

하 센터장 설명에 따르면 기후나 환경, 1차 산업, 기초과학 등은 기업이 직접 접근하기 힘들다. 이런 부분을 출연연에서 챙겼으면 한다는 의미다. 그는 "국내에 반도체 출연연은 없다. 삼성과 LG가 잘하기 때문"이라고 예를 들어 설명했다.

AI도 마찬가지다. 그는 "AI 전체 분야를 다 하는 기업은 없다"며 "현재 AI 기업은 너무 어렵거나, 당장 하기에 부담스럽고 돈 많이 드는 AI 분야에 접근하기 힘들다"고 말했다. 그는 "AI 전쟁 상황에 기업이 잘하는 건 시장에 맡기고, 기업이 어려워하는 분야는 출연연이 역할을 해주면 효율적일 것"이라고 강조했다.

관련기사

"조금이라도 더 믿을 수 있는 AI 만들 것"

하정우 AI혁신센터장은 현재 '신뢰할 수 있는 AI' 연구에 가장 많은 시간을 보낸다고 했다. 그는 "AI 발전에 가장 필요한 요소는 지속 가능성"이라며 "사람들이 AI를 좀 더 믿고 활용할 수 있는 방안을 기술적으로 연구 중이다"고 말했다.

그는 책에서 환각 현상이나 알고리즘 편향으로 인해 '현재 AI 성능은 100점 만점에서 70점'이라고 했다. 하 센터장은 "나머지 30점을 채우는 건 인간 몫"이라며 "사람이 좀 더 신뢰할 수 있는 AI를 기술적으로 구현할 수 있도록 노력하겠다"고 말했다.