취준생에겐 기회, 쏘카엔 혁신…아이펠 수강생 만나보니

쏘카 데이터 활용해 인공지능(AI) 접목 학습…"데이터·AI는 중요 자산"

인터넷입력 :2021/11/25 16:41    수정: 2021/11/25 23:12

구글 브레인 설립자인 앤드류 응 스탠퍼드대 교수는 데이터, 인공지능(AI) 가치를 각각 석유, 전기에 빗대어 표현했다. 석유, 전기가 그간 산업 성장의 촉매제 역할을 했다면, 이제 데이터와 AI가 스포트라이트를 받게 될 것이란 관측이다.

4차산업혁명 시대다. 석유를 정제하고, 전기·전자 기반 사업으로 승승장구한 기업의 가치가 높게 평가됐던 세상에서 데이터를 근간으로 한 정보기술(IT), 플랫폼 등 기업이 주목받는 세상이다. 산학도 발맞춰 가고 있다. 기업은 '개발자 모시기'에 한창이며, 개발자를 꿈꾸는 청년들도 부지기수다.

모빌리티 플랫폼 쏘카도 이런 기류에 따르고 있다. 쏘카는 최근 AI 혁신학교 '아이펠(AIFFEL)'을 운영하는 모두의연구소와 손을 잡으며 개발 인재를 양성하는 데 힘을 주고 있다. 아이펠 수강생들은 쏘카 데이터를 분석하고, AI 프로젝트를 수행하면서 미래 산업에 최적화한 인력으로 성장할 기회를 얻게 된다.

(사진=쏘카)

지디넷코리아는 지난 18일 미래 개발자를 꿈꾸는 아이펠 수강생들을 메타버스 플랫폼 '게더타운'에서 만나 교육 과정과 학습 소스로 활용된 데이터, 그리고 AI 등에 대해 얘기를 나눴다. 아이펠에서 미래 개발자를 꿈꾸는 이혁, 최혜림씨는 취업준비생이다. 두 사람 모두 컴퓨터공학과를 졸업했다.

이씨는 한 스타트업에 적을 두다가, AI에 흥미가 생겨 개발자를 꿈꾸게 됐다. 최씨는 풀스택 개발자로 일하다, 자연어처리(NLP)에 관심을 갖기 시작했다. 그는 심화 학습이 필요하다는 생각에 아이펠을 선택했다.

[다음은 이혁·최혜림씨와의 일문일답]

Q. 아이펠을 택한 이유.

이혁(이): AI 분야와 모빌리티 산업에 평소 흥미를 느꼈어요. 미국에서 공부하던 중 우연히 테슬라 자동차를 탔습니다. 그때 자율주행 시스템을 연구해보고 싶다고 생각했죠. 자연스레 AI 공부해야겠단 목표를 세웠어요. 아이펠 커리큘럼이 눈에 들어오더라고요.

최혜림(최): 공장 센서 데이터를 활용한 회사에서 풀스택 개발자로 4년 동안 일했어요. 공장 데이터가 누적되는 걸 보고, ‘이걸 활용해보면 어떨까’ 싶었죠. 혼자 공부하기보다, 기업 데이터를 이용해 학습 효율성을 높여야겠다고 생각했습니다. 아이펠의 토론 교육 방식도 마음에 들었어요.

아이펠 수강생들이 메타버스 플랫폼 '게더타운'에서 지디넷코리아와 인터뷰를 진행하고 있다.

Q. 아이펠 교육의 장점.

이: 실생활에 적합한 데이터란 점이에요. 쏘카는 많은 이용자를 보유한 플랫폼이죠. 이 데이터를 혼자선 수집할 수 없습니다. 이 정제된 데이터를 실제 활용해보는 건 흔치 않은 기회입니다.

최: 고객 상담, 정비 이력 등 쏘카 데이터를 통해 NLP가 실제 기업에서 어떤 방향으로 쓰이는지 체험할 수 있어 좋았어요. 모빌리티 산업에서 데이터가 활용되는 구체적인 경로와 체계를 경험하는 거죠.

Q. 아쉬웠던 점을 꼽자면.

이: AI 교육은 크게 데이터사이언스와 컴퓨터비전, 그리고 NLP 세 가지 범주로 나눠볼 수 있어요. 아이펠에서 모두 한 번씩 다루는 주제들이죠. AI를 처음 접한 사람이라면, 전체 틀을 다질 수 있어 유용할 것 같습니다. 다만 저 같은 경우, 컴퓨터 비전에 특히 관심이 컸어요. 컴퓨터 비전을 좀 더 세부적으로 다뤘으면 어땠을까 생각했어요.

최: AI를 처음으로 접할 때 이 분야가 이렇게 다양한 줄 꿈에도 몰랐어요. 공부량이 방대하고, 시간이 부족했던 것 같아요. 저도 교육 동안 관심 분야인 NLP에 집중적으로 시간을 투자했다면 좋았을 것 같아요.

(사진=쏘카)

아이펠 교육 과정은 6개월이다. 먼저, 3개월 동안 AI와 데이터 분석 이론을 공부한다. 남은 기간은 실전 학습. 쏘카 데이터를 통해 차량파손 탐지, 수요예측, 주차 여부 판단 등 실제 산업 현장에서 쓰이는 내용을 주제로 실습한다. 수강생들이 고잉디퍼와 해커톤 프로젝트 과정을 거쳐 문제를 해결하는 방식이다.

‘실제 데이터를 AI에 어떻게 접목할까’란 궁금증을 해소할 수 있는 계기가 됐다고 두 사람은 입을 모았다. 이론과 현장 데이터, 실제 활용 과정 등 내용을 단기간 섭렵하는 건 개별 학습으론 불가능한 일이라고도 이들은 말했다.

Q. 학습 내용을 토대로 구현하고 싶은 시스템이 있다면.

이: 쏘카 차량을 탑승, 반납하기 전 이용자들은 사진을 찍어요. 파손 여부를 확인해야 하니까요. 그런데 수집된 이미지가 전부 달라요. 사진 구도와 촬영 방법이 각양각색이라서 그렇죠. 은행 앱을 보면 신분증을 촬영할 때 기준이 있어요. 쏘카 앱에도 이런 기틀을 만들면 어떨까 생각했어요. 동일한 규격의 이미지 데이터를 만드는 거죠. 

최: 고객 상담, 정비 메모 등 프로젝트를 진행했을 때였어요. '쏘카 상담원들이 편하게 일할 수 있는 환경을 조성하면 좋겠다'는 생각이 문득 들었죠. AI를 활용하면 충분히 가능한 일이에요. 가령 고객과 상담이 끝나면 이력이 남죠. 문자 데이터로 전환할 때, 오탈자를 자동으로 바꿔주는 시스템을 만들면 상담원들이 일하기 훨씬 수월할 것 같습니다.

쏘카-라이드플럭스 무료 자율주행 셔틀 서비스 자료사진. (사진=쏘카)

Q. '데이터 시대'란 말에 공감하는지.

이: 아마존, 구글, 페이스북(메타) 등 글로벌 기업들이 근래 산업을 주도하고 있죠. 공통점이 뭘까요. 데이터를 기반으로 한 회사입니다. 이것만 봐도 알 수 있어요. 생산 공정을 거쳐 재화를 판매하는 기업의 경우 정체된 반면, 데이터를 토대로 한 회사들은 꾸준히 성장세를 나타내고 있습니다.  

최: 제가 정의한 데이터는 중요한 자산이에요. AI도 마찬가지죠. 데이터, AI는 앞으로 우리가 살아가는 동안 불편하게 느낄 만한 것들을 메워줄 거에요. 단점을 보완해주는 거죠. 현재 우리가 체감하고 있는 세상입니다.

Q. 미래 개발자로서 목표는.

관련기사

이: 소량 데이터를 갖고도 충분히 이미지 분류가 가능한 알고리즘을 만들고 싶어요. 이는 자율주행 기술 발전에 기여하는 방향이기도 합니다. 개발자를 넘어, 삶의 목표입니다.

최: 아직 한국어 NLP는 발전 단계라고 봐요. 영어보다, 아직 데이터 측면에서 부족하다고 생각합니다. NLP 처리 과정에서 한국어를 통한 AI 학습이 쉬워지도록 변화를 주고 싶어요.