레드햇이 하둡분산파일시스템(HDFS)에 맞설 자체 오픈소스 기술을 만든다. 당장은 빅데이터가 아니라 클라우드 때문이다.
회사는 20일(현지시각) '레드햇스토리지 하둡플러그인'을 소개했다. 이는 HDFS 대신 쓸 수 있는 기술로 소개됐다. 아파치소프트웨어재단(ASF)을 통해 연내 공개될 전망이다.
앞서 레드햇은 지난 2011년 사들인 글러스터 기술을 녹여 '레드햇스토리지서버'를 만들기도 했다. 이는 회사의 하이브리드클라우드 플랫폼 대응 전략의 일환이다.
출시를 예고한 하둡플러그인 기술도 같은 맥락으로 읽힌다. 레드햇의 데이터저장기술로 하둡기반환경보다 안정적이고 호환성이 뛰어난 데이터플랫폼을 제공할 수 있다는 자신감이다.
이날 레드햇은 레드햇스토리지가 지오리플리케이션, 고가용성(HA), POSIX 컴플라이언스, 재해복구(DR), 관리같은 엔터프라이즈급 빅데이터환경에 데이터지역성과 API호환성을 타협치 않고 대응케 해준다고 주장했다.
이에 따라 사용자들은 통합된 데이터와 파일 및 객체를 물리적인 영역이든 가상화 공간이든, 퍼블릭이나 하이브리드 클라우드 영역에 아울러 배포할 수 있는 규모가변적 스토리지 소프트웨어플랫폼을 얻게 됐다고 강조했다.
레드햇의 파일시스템은 대다수 하둡클러스터에서 데이터 트랙을 유지하는 네임노드를 쓰지 않는다. 네임노드가 하둡 환경에서 실패단일점(SPOF)이자 병목구간이 되기 때문이다.
물론 하둡커뮤니티에서도 아파치 하둡 2.0 버전을 내놓으며 이런 약점을 완화시키긴 했다. 하둡을 쓰는 페이스북에선 '아바타노드'라 불리는 자체기술로 대응중이기도 하다.
또 레드햇은 스토리지와 가상화 기술을 통합해 같은 물리적 환경안에서 누구나 가상화된 스토리지 및 컴퓨팅 자원영역을 나눠 구성할 수 있게 했다.
이 회사가 HDFS의 취약함을 없애거나 대기업 환경에 맞춰 기술을 개선시키려 한 유일한 회사는 아니다. EMC, 넷앱 등 스토리지솔루션 업체들 여럿이 자체 기술을 보유했다. 퀀트캐스트란 업체는 HDFS를 분기시켜 만든 기술에 회사 이름을 붙이기도 했다.
관련기사
- 인포매티카 "코딩 없이 하둡 데이터통합"2013.02.21
- 페도라-오픈수세, 오라클 마이SQL 뺀다2013.02.21
- 레드햇, 위키피디아 이어 마이SQL 버리나2013.02.21
- "빅데이터시대 SQL활용-하둡혼용 많아질 것"2013.02.21
레드햇이 하둡 대응기술에 투자하는 배경은 빅데이터에 초점을 맞춰서가 아니다. 회사는 오픈소스 기반의 엔터프라이즈 클라우드컴퓨팅 플랫폼을 갖췄고 이를 분산환경에 확산시킬 때 필요한 데이터저장 방식으로 효율적인 기술을 연구중이다.
물론 아직은 불분명하지만 빅데이터에 직접 대응하게 될 가능성도 있다. 기업들의 클라우드에 대한 투자가 향후 빅데이터을 다루는 애플리케이션 구동으로까지 확대될 경우다. 오픈스택이나 아마존웹서비스(AWS) 클라우드같은 사업자들에게도 마찬가지다.