SAS 분석 플랫폼, AI 전진 배치

컴퓨팅입력 :2018/04/10 09:36

[덴버(미국)=김우용 기자] SAS는 인공지능(AI)과 자동화 기능을 강화한 ‘SAS 플랫폼’과 한층 더 향상된 ‘SAS 바이야(SAS Viya)’ 최신 기능을 9일(현지시간) 공개했다.

SAS는 8일부터 미국 덴버에서 개최한 ‘SAS글로벌포럼 2018’ 행사에서 데이터 과학자와 비즈니스 사용자 간의 협업을 최대화하고, 강력한 분석 모델을 보다 쉽게 개발, 배포하는 솔루션과 활용 사례를 발표했다.

오는 6월 출시될 SAS 바이야의 새로운 기능은 임베디드 AI 및 자동화, 투명성 제고, 데이터 거버넌스 개선, 사용자 경험 제고, 개방성 확대 등을 특징으로 한다.

올리버 샤벤버거 SAS 최고운영책임자(COO) 겸 최고기술책임자(CTO)

사용자는 SAS 바이야를 이용해 모델 구축 및 배포를 자동화함으로써 다양한 모델을 테스트하고 최상의 모델을 빠르게 선택할 수 있다. SAS는 좋은 모델의 핵심 요건인 피처(feature) 엔지니어링 기능을 추가하고 모델의 정확도를 개선할 방침이다. SAS는 자연어처리(NLP)를 위해 순환신경망(RNN)을 이용한 감정 분석과 문서 분류를 자동화하고 있다.

머신러닝과 딥러닝 기술의 발전으로AI와 머신러닝 분야에서 공정성, 책임감, 투명성 등의 원칙이 중요해졌다. SAS 바이야 최신 기능은 LIME(Local Interpretable Model-Agnostic Explanation), ICE(impact, confidence and ease)와 같은 산업 프레임워크를 이용해 해석력과 투명성을 향상시켜 이러한 원칙을 지킨다.

사랍 굽타 SAS 애널리틱스 프로덕트 담당 이사는 “사용자가 인공지능이나 머신러닝 기술을 이용할 때 ‘블랙 박스’에 의존하도록 강요돼선 안 된다”라며 “SAS 인공지능과 고급 분석 기술에 LIME, ICE와 같은 산업 프레임워크를 결합해 데이터 과학자와 비즈니스 사용자 모두 모델의 예측 로직을 더 쉽게 해석하고 설명할 수 있도록 지원한다”고 설명했다.

SAS 플랫폼은 전체 분석 라이프사이클에 걸쳐 데이터 리니지(data lineage)를 개선했다. 정형 및 비정형 등 모든 데이터 간의 관계를 시각화해 데이터가 서로 어떻게 연관돼 있는지 파악할 수 있는 직관력을 제공한다. 이를 통해 에러와 불필요한 데이터 중복을 더 쉽게 파악하고 적절한 데이터를 사용할 수 있다.

사용자는 SAS 바이야의 모델 성능 대시보드를 이용해 클릭만으로 개별 모델의 성능을 쉽게 확인할 수 있다. 대시보드는 새로운 데이터가 추가되거나 기대에 비해 성능이 저조한 경우 모델 업데이트를 스케줄링하거나 자동화할 수 있는 옵션을 제공한다.

SAS는 데이터 과학자, 분석가, 개발자 등 모두에게 일관적인 사용자 경험을 제공함으로써 전사에 걸쳐 분석이 이용되도록 돕는다. 생산성을 높이고 협업을 가능하게 하기 위해 설계된 인터페이스로 사용자는 ‘데이터-탐색(Discovery)-적용(Deployment)’에 이르는 전체 분석 라이프사이클의 모든 단계를 원활하게 처리할 수 있다. SAS 드라이브는 프로젝트와 관련해 SAS 제품을 위한 중앙 저장소 역할을 해 협업을 강화한다.

SAS는 이외에도 수세(SUSE) 리눅스와 윈도 대칭형 멀티 프로세싱(SMP)을 위한 GPU 및 운영 체제 지원을 강화해 사용자 경험을 한층 더 향상시켰다.

관련기사

SAS 플랫폼은 외부 시스템에 대한 개방성과 상호운용성이 한층 향상됐다. 사용자는 SAS 머신러닝 파이프라인을 이용해 오픈 소스 코드를 삽입할 수 있다. SAS 플랫폼 최신 기능은 세일즈포스, JDBC 등에 대한 개방형 접근과 탐색 및 리포팅 과정에서 오픈 소스 자바스크립트 시각화 기능을 포함한다. 앱 개발자가 스마트폰이나 태블릿용으로 다양한 개인별 맞춤형 모바일 앱을 더 쉽게 개발할 수 있도록 모바일 소프트웨어 개발 키트(SDK)를 제공한다. 의사결정 플로우가 파이썬(Python) 모델을 지원한다.

올리버 샤벤버거 SAS 최고운영책임자(COO) 겸 최고기술책임자(CTO)는 “양질의 데이터는 고품질 분석을 위한 토대이며 새로워진 SAS 바이야는 데이터 과학자와 비즈니스 사용자가 분석을 위해 데이터를 정리, 준비, 변환할 수 있도록 지원한다”며 “사용자는 데이터 준비를 자동화함으로써 가장 중요한 변수와 필드를 식별하고, 더 정확하고 효과적으로 분석할 수 있다”고 강조했다.