"티맥스 DB·WAS·클라우드·OS에 AI 들어간다"

티맥스데이터 황창호 AI본부장 인터뷰

컴퓨팅입력 :2019/02/25 14:32    수정: 2019/02/25 14:33

"티맥스 4사가 인공지능(AI)본부 연구 내용을 활발히 공유하고 있다. 올해부터 티맥스클라우드, 티맥스오에스, 티맥스데이터, 티맥스소프트 등 네 회사가 보유한 제품에 AI가 적용된 모습을 보게 될 거다."

티맥스데이터 연구소의 황창호 AI본부장이 최근 인터뷰 자리에서 이같이 말했다. 그는 데이터베이스(DB), 웹애플리케이션서버(WAS), 클라우드컴퓨팅, 운영체제(OS) 등 티맥스 4사의 주력 제품 기술과 차세대 제품 및 서비스에 적용할 AI기술을 연구하는 AI본부의 연구 책임자다.

황 본부장은 2007년 서울대 전기컴퓨터공학과 졸업 후 티맥스데이터에 입사해 2017년까지 데이터베이스(DB) 제품 '티베로'의 기반 기술을 연구해 왔다. 2년 전부턴 회사의 AI 기술 활용 가능성을 가늠하는 선행연구를 진행했다. 이후 회사가 AI 연구개발을 본격 추진하며 AI본부장을 맡게 됐다. 그는 AI본부 소속 50여명 규모 인력과 함께 '티맥스 4사' 차세대 기술, 제품과 서비스에 적용 가능한 AI 기술을 연구 중이다.

인터뷰 자리에서 황 본부장은 그간 티맥스 4사 전체 제품에 녹일 수 있는 AI 기술의 연구를 진행해 왔다는 점, 올해 이후부터 그런 기술을 녹인 제품들이 등장할 것이라고 예고했다. 더불어 AI 연구가 특성상 티베로 DB같은 제품 개발과 다른 점, 올해 AI본부의 연구 목표와 티맥스의 전략, 연구전략 일환으로 오픈소스를 적극 활용하고자 하는 방법론과 관점에 대해서도 언급했다.

티맥스데이터연구소 황창호 AI본부장. [사진=티맥스]

황 본부장과의 인터뷰를 일문일답으로 정리했다.

- 티맥스데이터 연구소 조직은 어떻게 구성돼 있고, AI본부와 AI본부장 역할은 뭔지

"티맥스는 모든 소프트웨어 스택 기술을 연구한다. 데이터 연구소는 그중 데이터와 관련된 연구를 수행하는 조직인데 DB본부, SE본부, AI본부로 나뉜다. DB본부는 잘 알려진 티베로 DB제품을 개발하는 곳이고, SE본부는 전사적자원관리(ERP) 애플리케이션을 연구하는 곳이다.

AI본부 주력 분야는 빅데이터 플랫폼과 모델링을 포함한 AI 기술 연구다. 본부 업무에 블록체인 등 신기술 분야 연구도 포함된다. 본부장의 역할은 두 가진데, 하나는 큰 연구방향을 잡는 것이고, 다른 하나는 개별적으로 진행되는 연구 내용을 가지고 담당자와 토론하는 거다."

- AI 분야 업무를 맡게 된 계기가 뭐였는지

"서울대학교 전기컴퓨터공학부를 졸업하고 티베로DB 개발 연구원으로 일해 왔다. 8년반동안 맡은 일이었다. 그간 빅데이터 열풍이 불었다. 이전까지 어떻게 외부 데이터를 더 잘 저장하고 꺼내줄까에만 빠져 있었는데, 이후 데이터 분석을 통해 가치를 얻는 데 도전하게 됐다.

데이터 분석을 통한 가치 확보에 도전하겠다는 생각을 품은 뒤 빅데이터 팀장이 됐고, 연구원 업무를 맡은지 9년 넘어갈 때쯤 데이터를 잘 분석할 수 있는 기술로 딥러닝과 같은 AI 기술이 대두되기 시작했다. 회사가 시장 요구에 대응하고자 필요로 하는 세부연구, 조사를 맡았다.

선행조사를 진행하면서 그 매력을 크게 느꼈다. 이전까지 AI 기술을 잘 몰랐고, 학문적으로도 관심이 없었는데, DBMS같은 시스템 소프트웨어 연구원으로선 상상할 수 없었던, '기계가 사람말을 알아듣다니' 싶은, 이런 분야에 눈을 떴다. 이제 연구한지 2년을 좀 넘겼다."

- AI본부 안의 주요 연구주제가 뭔지, 연구 결과물을 제품 수준으로 구현하는지 궁금하다

"빅데이터와 AI 영역의 여러 목표를 갖고 있다. 빅데이터는 기업에서 가진 데이터를 분석해 인사이트, 돈이 되는 가치를 얻어내는 거다. 그걸 위해 다차원분석이나 여러 통계 기법을 활용할 수 있다. 머신러닝, AI는 그걸 위해 비교적 최근에 활용할 수 있게 된 기법이고.

AI 연구는 AI모델링을 하는 기술을 다루는 것이기 때문에, 제품화라고 표현할 수는 없다. 다만 AI모델링은 빅데이터플랫폼에 하나의 방법론으로 활용된다. 제품화를 목표로 과거 '애니마이너'라는 빅데이터플랫폼을 개발했고 현재 그 설계를 확장한 '하이퍼데이터'를 개발 중이다."

- 하이퍼데이터의 개발 목표와, 애니마이너 대비 차별화 지점을 설명해 달라

"하이퍼데이터는 데이터 가상화, 데이터 분석과 시각화, 수집 등 측면에 효율성을 추구한 빅데이터 통합 플랫폼이다.

데이터가상화는 현업 담당자가 다른 곳에 흩어진 데이터들을 자기 컴퓨터에 있는 것처럼 가져와 투명하게 쓸 수 있게 해주는 기술이다. 분석할 데이터가 여기저기 흩어져 있는 상황에서, 분석 담당자가 그걸 직접 가져오는 부담과 해석하기까지 걸리는 시간 문제를 덜어 준다.

데이터분석 문제엔 두 가지로 접근했다. 하나는 '기술통계'에서 따온 '기술(descriptive) 분석'이다. 주어진 데이터가 어떤 특성을 가졌는지 나타내는 데 최적 방법을 제공한다는 데 초점을 맞췄다. 다차원분석이나 비즈니스인텔리전스(BI)처럼 '시각화'를 추구한다. 또 하나는 데이터 기반으로 현재 상황을 이해하고, '추론(inferential)'으로 미래를 예측하는 분석이다. 딥러닝과 머신러닝을 접목해 이 분석을 수행할 수 있다.

여기에 한 가지를 더한다면 분석 대상에 단지 흩어진 것뿐아니라 새로운 유형의 데이터를 포함시키는 개념이다. 로그, 소셜네트워크서비스, 웹문서, 사물인터넷(IoT) 센서 등 이런 데이터를 분석 대상에 포함시키려는 욕구가 많다. 이런 '수집' 영역에 집중했던 게 기존 애니마이너 플랫폼이다. 하지만 데이터 수집을 넘어 가치를 얻는 게 중요하다고 판단, 나머지 세 영역에 집중하면서 하이퍼데이터를 개발하게 됐다."

- 연구 결과물은 각 사업 조직에서 어떻게 활용되나

"겉으로 볼 때 '티맥스 4사'는 독립된 네 회사지만 사실 한 몸처럼 협력하는 조직이다. 연구 내용을 4사가 활발히 공유하고 있고. 앞서 말한 하이퍼데이터 빅데이터플랫폼이나, AI 분야 음성지능·시각지능·언어지능 모두 연구되고 있고, 다른 티맥스 관계사 제품에 영향을 준다.

아직 출시되지 않았지만 대표 사례로 티맥스OS 차기 버전(4.0)에 탑재될 AI 기술이 있다. 코드명 'AI-ET'라는 이름의 지능형 비서다. 이걸 탑재한 티맥스OS와 내가 대화하고, 내가 원하는 걸 OS에 명령하고 물어볼 수 있게 된다. 코드명의 ET는 에브리씽(EveryThing)을 뜻한다.

또 클라우드플랫폼 '프로존'을 기반으로 구축된 프로존데이터센터(PDC)의 운영 기술에도 AI를 접목하고 있다. 하드웨어 장비 상태를 모니터링하고 그 장애 발생 여부나 교체 시점을 예측한다든지, 어떤 애플리케이션의 수요예측을 위해 AI 활용방안을 활발히 연구 중이다.

티맥스 관계사가 제공하는 여러 제품이 있는데 모두 앞으로 '지능형'이라는 말이 붙게 될 것이다. 지능형이 AI 응용을 의미한다. 티베로DB에도 다음 버전은 '지능형 관계형DBMS'가 되고, 다른 제품도 지능형 WAS, 지능형 클라우드 서비스형인프라(IaaS) 등으로 불릴 것이다."

- 여러 AI 모델과 프레임워크가 오픈소스로 공개돼 있는데, 티맥스에서도 활용하고 있나

티맥스데이터연구소 황창호 AI본부장. [사진=티맥스]

"딥러닝 기반 AI를 학습시키는 도구로 전 세계가 텐서플로(TensorFlow)를 활용하고 있는데, 우리도 그걸 쓴다. 새로운 분야에 도전할 때 당연히 오픈소스로 만들어진 걸 먼저 찾는다. 그걸 통해 우리도 선행 연구 성과를 빠르게 팔로업하고 도움을 얻는다고 할 수 있다.

다만 우리는 오픈소스를 '블랙박스'처럼 여기지 않는다. 우선 아키텍처를 면밀히 검토한 다음 어떤 오픈소스를 활용할 것인지 선택한다. 그런 분석과정을 통해 신기술을 빨리 익히기도 하고, 사용하면서 어떻게 개선하는 것이 좋겠다, 이런 걸 고민한다."

- 하이퍼데이터도 '하둡'같은 오픈소스 기술을 활용해서 개발한 건가

"처음 빅데이터플랫폼 연구를 할 때 하둡을 갖고 아키텍처를 설계했고, 그외에 여러 오픈소스를 많이 써 본 것은 맞다. 하지만 지금 하이퍼데이터에는 오픈소스 코드가 하나도 남아 있지 않다. 오픈소스에 의존해 구현한 기술은 고객 니즈를 해결해야 할 때 막히는 경우가 많다.

플랫폼에 고객의 데이터를 담고 현업의 니즈를 해결하려다 보면 문제점이 발견된다. 기능을 추가하고, 성능을 향상시키고, 버그를 고쳐야 하는 상황이 온다. 그걸 오픈소스에 그대로 적용하려 하면 아키텍처상 문제에 부딪힐 때가 대부분이다. 결국 원천기술로 구현하게 된다."

- 오픈소스를 이용하다가 굳이 원천기술로 만드는 이유가 뭔가

"빅데이터를 처음 연구할 때 하둡을 엔진으로 쓰면서 아키텍처를 살폈다. 처음부터 전체를 파악하기 어렵기 때문에 그 골격을 1차로 가져간다. 하둡과 엘라스틱서치같은 걸 집어넣어 만들어 본 것을 제품화하는 과정에서, 문제가 많이 발견되면 '아웃'시키는 식이었다.

하둡과 같은 큼직한 프로젝트는, 여러 사람이 참여해 개발하는 과정에서 아키텍처상 문제가 발견된다. 각 요소가 개별적으로 디자인되다보니 전체 관점에서 비효율적인 면도 보인다. 또 그런 방대한 소스를 필요할 때마다 일일이 들여다보고 수정하는 게 가능할까도 의문이다."

- 실제 오픈소스 기능을 재개발해 자체 기술로 만든 사례는

"티베로 RDBMS에 녹인 구조가 그랬다. 티베로 3, 4, 5, 6 버전의 발전 과정 대비 이후 6과 7 버전의 차이는 그냥 별개 제품이나 마찬가지다. 과거 RDBMS 쿼리엔진에서 정형데이터만 다루던 엔진이었다가, 티베로7은 실시간 스트림데이터를 분석할 수 있는 아키텍처로 바뀌었다.

티베로는 과거 쌓아 온 기술과 실제 제품에 녹아 있는 소스에서 조합해 활용할 게 많다. 티베로7에서 엘라스틱서버만 스토리지서버에 있으면 하둡처럼 비정형 데이터를 SQL로 분석하는 요구를 티베로에 녹일 수 있겠다고 싶어서, 이제 하둡은 필요 없겠다 판단했다."

- 텐서플로 프레임워크도 비슷한 의도로 활용한다고 보면 되나

"AI본부가 연구 중인 딥러닝 엔진이 1차적으로 텐서플로를 이용한 버전이다. 우리는 텐서플로를 활용한 AI의 모델링 기술도 연구한다. 이런 알려진 기술을 어떻게 잘 활용할지 연구하는 것에 더해, 그 동작원리와 아키텍처 등 기술 자체를 우리 걸로 만드는 과정을 계속하고 있다.

구글 딥마인드같은 조직의 똑똑한 사람들이 AI 모델을 만들어 선보이면, 그걸로 딱 선보인 만큼의 성능을 얻을 수 있다. 기술을 블랙박스처럼 접근해선, 거기서 조금만 변형되거나 복잡해지면 기대한 결과를 못 얻는다. 우리는 그 기반 기술을 알아내고 응용하는 데 자신이 있다."

- 오픈소스에서 도움을 얻는다면 그에 상응하는 기여도 해야할 것 같은데

"이제 좀 하려고 한다. AI 모델을 연구한다고 말씀드렸는데 그 중 괜찮은 모델을 갖게 되면 공개할 계획이다. 오픈소스 커뮤니티에 기여해 다른 외부 연구자들의 비판을 받고, 연구자들과 경쟁하면서 발전할 수도 있도록 준비하고 있다. 그 자체가 목표는 아니지만.

텐서플로 프로젝트는 아니지만, 다른 프로젝트에서 그런 활동 경험이 아예 없는 건 아니다. 오픈소스 대화형 AI 엔진 가운데 '라사(Rasa)'라는 것을 다뤄 보고 있는데, 뭘 어떻게 개선했더니 뭐가 좋아지더라 하는 경험이 있어, 그 프로젝트에 일부 커밋도 하고 있다."

- 올해 AI본부의 연구 목표가 있다면

관련기사

"AI본부는 누구나 쉽게 데이터를 구하고 분석할 수 있는 환경, 그 분석에 필요한 도구, 머신러닝과 딥러닝으로 대표되는 다양한 분석 알고리즘을 지난해까지 많이 연구해 왔다. 앞으로도 그 연구를 계속 이어갈 예정인데, 지난해부터 올해 사이에 그 결과물이 많이 나오고 있다.

연구 결과물을 갖고 고객을 만날 수 있는 준비가 돼 가고 있다. 그 많은 부분이, 특히 하이퍼데이터가 상반기 제품화될 예정이다. 고객사 환경에 적용해 보고 싶다. 티맥스의 기술력과 고객 신뢰를 바탕으로 많은 기회를 포착하고 더 정교하게 기술을 다듬어가는 게 올해 목표다."