빅데이터와 소셜미디어로 주가 예측하면?

일반입력 :2013/11/21 13:33    수정: 2013/11/21 15:16

코스콤이 소셜미디어 기반 주가예측을 통해 기존 분석과 같은 '하향식' 접근과 광범위한 데이터에서 통찰을 얻는 '상향식' 접근 모두 타당하다는 진단을 내렸다.

코스콤은 21일 서울 삼성동 EMC '이펙트데이' 행사장에서 '빅데이터로 주가를 예측하다'라는 주제 발표를 통해 연초부터 진행해온 주가예측분석 플랫폼 도입과 활용 경험을 제시했다.

현장에서 강태홍 코스콤 자본시장IT연구소장은 분석과 통찰 가운데 (과거엔) 분석을 더 중시했는데 빅데이터를 통해 통찰을 얻는 전략도 고려해 볼만하다며 기존처럼 목표를 설정해 놓고 접근하는 하향식 접근과 광범위한 데이터 소스를 통해 저인망식으로 월척을 낚는 상향식 접근 모두 가능해 보인다고 언급했다.

코스콤은 앞서 상반기 '빅데이터 분석과 활용을 위한 파일럿 시스템 구축' 프로젝트를 진행하며 소셜미디어 데이터를 활용한 예측분석 시스템을 만들었다.

이후 예측 신뢰도를 높이고 사업모델을 발굴하면서 지난 8월부터 최근까지 'K인덱스'라는 이름으로 자체 개발한 감성분석지수를 주가분석모델에 시범 활용 중이다.

이날 강 소장 발표는 플랫폼 구축 이후 소셜감성분석 지수 K인덱스를 통해 국내 장단기 주가예측을 수행한 경험에 초점을 맞췄다. 코스콤은 K인덱스를 통해 시장의 전환점, 하락세와 상승세, 침체 또는 과열 분위기 등을 파악할 수 있다고 밝혔다.

코스콤의 주가분석지수 'K-SMD12'는 국내외 증시 동향과 감성분석을 바탕으로 5일 미만의 단기예측을, 'K-SMD26'는 통계청 지표를 활용해 1개월, 6개월 이후 등 중기예측에 쓰인다.

이날 강 소장은 최신 주가 예측 시스템 구축시 확장성을 위해 최대한 오픈소스를 활용하려 했다는 방침도 제시했다. 실제로 주가예측 시스템 구축 단계별 세부 지침에 시스템 확장성을 고려시 최대한 오픈소스를 활용한다는 내용이 포함돼 있었다.

강 소장은 주가예측 시스템의 데이터 분석과 운영환경을 구축하기 위해 오픈소스 분산처리 기술 하둡과 분석용 프로그래밍 언어 R을 적용했다며 기반 플랫폼 마련, 시스템 확장성 보장, 분석을 위한 예측모델 개발 3가지에 초점을 맞췄다고 설명했다.

관련기사

다만 회사가 제시한 사례에서 하둡이나 R같은 오픈소스 기술 도입에 따른 경험은 언급되지 않았다. 실제 플랫폼 구축과 기술 도입 자체에는 기성 솔루션 공급 업체의 역량에 의존한 모양새다.

코스콤은 주가예측 시스템의 외부 데이터 저장 용도로 그린플럼 데이터웨어하우스(DW)의 하둡 연결 기능을 썼고 R기반 분석 및 시각화를 위해 레볼루션어낼리틱스의 상용 제품 '레볼루션R' 엔터프라이즈 버전을 도입했다.