오라클, 히트웨이브 생성형AI 발표…추가비용 無

오라클은 인데이터베이스(in-database) 거대언어모델(LLM), 자동화된 인데이터베이스 벡터 저장소, 확장 벡터 처리, 자연어 대화 기능 등을 제공하는 '히트웨이브 생성형AI(GenAI)'를 출시한다고 2일 밝혔다.

히트웨이브 생성형 AI는 데이터베이스 내에서 벡터 프로세싱과 LLM을 처리하므로 별도 벡터 데이터베이스로 데이터를 이동시키지 않아도 된다. 기존 히트웨이브 고객이라면 오라클 클라우드 리전과 오라클 클라우드 인프라스트럭처(OCI) 전용 리전 및 여타 주요 클라우드 서비스 전반에서 추가 비용 없이 즉시 이용 가능하다.

히트웨이브 생성형AI는 내장형 임베딩 모델을 사용해 단일 SQL 명령어로 기업의 비정형 콘텐츠를 위한 벡터 저장소를 생성할 수 있게 해 준다. 사용자는 인-데이터베이스 LLM, 혹은 외부 LLM을 사용해 단일 동작으로 자연어 검색을 수행할 수 있다. 데이터는 데이터베이스 내에서 안전하게 유지되며, 히트웨이브의 뛰어난 확장성과 성능 덕분에 GPU를 프로비저닝할 필요도 없다. 개발자는 결과적으로 애플리케이션의 복잡성을 최소화하는 동시에 성능 및 데이터 보안을 강화하고, 비용을 절감할 수 있다.

니푼 아가르왈 오라클 마이SQL 및 히트웨이브 개발담당 수석부사장(SVP)은 2일 한국기자단을 대상으로 열린 온라인 브리핑에서 “히트웨이브 생성형AI는 히트웨이브 레이크하우스, 히트웨이브 오토파일럿, 히트웨이브 오토ML, 히트웨이브 마이SQL 등 기존 내장형 히트웨이브 기술군에 추가된 최신 혁신”이라며 “오늘날의 통합 및 자동화된 AI 기능은 개발자가 데이터를 이전하거나 AI 전문성을 확보하지 않고도 풍부한 생성형 AI 애플리케이션을 더욱 빠르게 구축할 수 있게 해 준다”고 설명했다.

자동화된 인-데이터베이스 벡터 저장소는 고객이 데이터를 별도의 벡터 데이터베이스로 이동하거나, AI 전문성을 갖추지 않고도 생성형 AI를 자사의 비즈니스 문서와 함께 사용할 수 있도록 지원한다.

객체 저장소에서의 문서 검색, 파싱(parsing), 고도로 병렬화 되고 최적화된 임베딩 생성, 벡터 저장소에 대한 임베딩 삽입 등 벡터 저장소 및 벡터 임베딩 생성을 위한 모든 과정이 자동화돼 있다. RAG용 벡터 저장소는 이 모델들이 보다 정확하고 유관한 답변 제공을 위해 적절한 맥락을 바탕으로 전문 데이터를 검색할 수 있도록 하여 LLM의 환각 문제 해결에도 도움을 준다. 파싱은 입력된 문자열을 분석해 그 구조를 파악하고 의미 있는 데이터로 변환하는 과정이다.

니푼 아가르왈 부사장은 “인데이터베이스 벡터저장소는 오브젝트 스토리지 내의 데이터를 히트웨이브 내부에서 처리하는 독특한 아키텍처를 가졌다”며 “데이터 처리 작업 과정은 히트웨이브 안에서 이뤄지지만 벡터스토어는 오브젝트 스토리지에 위치하고, 최저의 스토리지 비용으로 모델을 구현하면서 확장성과 안정성에서 매우 큰 이점을 얻게 한다”고 설명했다.

그는 “일반적으로 생성형 AI 앱을 만드려면 벡터스토어를 만드는데 아홉 단계, 벡터스토어를 LLM에 적용하는 데 또 아홉 단계가 필요하다”며 “히트웨이브 생성형 AI는 각각 하나의 생성커맨드면 모든 단계를 자동화할 수 있다”고 강조했다.

히트웨이브는 문서 식별, 파싱, 임베딩 생성, 벡터스토어 인서트 등의 단계를 하나의 명령어로 가능하게 했다. 문서 파악하고, 파싱, 임베딩 생성, 벡터스토어 최적화해 인서트하는 단계 필요한데. 히트웨이브는 이를 하나의 단계로 단축시켰다.

그는 “인데이터베이스로 벡터스토어 생성을 자동화한다는 건 새로운 문서가 들어올 때 인크리멘털한 방식으로 추가할 수 있다는 의미”라며 “과거엔 새로운 문서가 들어올 때 벡터스토어를 리크리에이트해야 해서 시간과 복잡성을 늘렸다”고 설명했다.

확장 벡터 처리는 일정한 정확도를 유지하면서 신속한 의미 검색 결과를 제공한다. 히트웨이브는 새로운 네이티브 벡터 데이터 유형 및 거리 함수의 최적화된 구현을 지원해 고객이 표준 SQL을 통해 의미 쿼리를 수행할 수 있도록 한다.

인-메모리 하이브리드 열 형식 표현 및 히트웨이브의 확장 아키텍처는 벡터 처리가 '니어 메모리' 대역폭에서 실행되고, 최대 512 히트웨이브 노드에서 병렬화 될 수 있게 한다. 그 결과 고객의 질문에 대한 답을 신속히 제공할 수 있게 된다. 또한 사용자는 의미 검색과 기타 SQL 연산자를 결합하여 여러 테이블을 다양한 문서로 조인하고, 모든 문서 전반에서 유사성 검색을 수행할 수 있다.

아가르왈 부사장은 “히트웨이브에 새로운 벡터 데이터 타입을 추가함으로써 효율적으로 쿼리를 사용할 수 있다”며 “높은 효율성은 히트웨이브가 여러 노드로 잘 확장되고, 인메모리에서 프로세싱되기 때문”이라고 설명했다.

그는 “히트웨이브는 쿼리 성능과 비용에서 업계 최고 속도로 벡터를 처리할 수 있다”고 강조했다.

인-데이터베이스 LLM은 생성형 AI 애플리케이션의 개발을 간소화하고, 개발 비용을 절감한다. 고객은 외부 LLM 선정 및 통합의 복잡성 없이도 생성형 AI의 이점을 누릴 수 있고, 다양한 클라우드 제공업체 데이터센터의 LLM 가용성에 대해 걱정할 필요도 없다.

아가르왈 부사장은 “히트웨이브는 데이터베이스에서 LLM을 구동함으로써 CPU를 활용하므로, 추가적인 별도의 GPU 서비스를 이용하지 않아도 된다”며 “물론, 외부의 OCI GPU 기반의 LLM 서비스를 가져와서 응용할 수도 있다”고 말했다.

인-데이터베이스 LLM은 고객이 히트웨이브 벡터 저장소를 활용해 데이터 검색, 콘텐츠 생성 및 요약, 검색증강생성(RAG) 등을 수행할 수 있게 해 준다. 또한 고객은 오토ML과 같은 기타 내장형 히트웨이브 기능을 생성형 AI와 결합해 보다 풍성한 애플리케이션을 구축할 수 있다. 히트웨이브 생성형AI는 OCI 생성형 AI 서비스에도 통합돼 고객은 최고의 LLM 제공업체들이 제공하는 사전 훈련된 기본 모델을 활용할 수 있다.

그는 “추가적으로 인데이터베이스 LLM과 오라클 히트웨이브 오토ML을 함께 사용했을 때 좋은 시너지를 발휘한다”며 “두 기능을 혼합했을 때 LLM을 활용해 쿼리 결과를 더 향상시킬 수 있고, 성능도 향상시킬 수 있으며, 인풋 데이터 양을 줄이므로 피딩되는 데이터를 줄여 비용도 절감할 수 있다”고 덧붙였다.

히트웨이브 챗(Chat)은 마이SQL 쉘용 비주얼 코드 플러그인으로 히트웨이브 생성형AI를 위한 그래픽 인터페이스를 제공하며, 개발자들이 자연어 또는 SQL로 질문을 할 수 있게 지원한다. 이 통합 레이크하우스 네비게이터는 사용자가 객체 스토리지로부터 파일을 선택하고 벡터 저장소를 생성할 수 있도록 지원한다. 사용자는 데이터베이스 전반에서 검색을 수행하거나, 검색 영역을 폴더로 제한할 수도 있다. 히트웨이브는 질문 내역, 소스 문서 인용 및 LLM 프롬프트를 바탕으로 컨텍스트를 유지 관리한다. 이는 상황별 대화를 용이하게 하고, 사용자가 LLM이 생성한 답변의 출처를 검증할 수 있게 해 준다. 컨텍스트는 히트웨이브에서 유지 관리되며, 히트웨이브를 사용하는 모든 애플리케이션에서 사용 가능하다.

히트웨이브 생성형AI는 아마존 베드록 기반의 날리지베이스를 사용할 때보다 PDF, PPT, 워드, HTML 형식 문서용 벡터 저장소 생성 속도에서 23배 빠르다. 비용은 4분의1 수준이다.

1.6GB에서 300GB 크기의 테이블에서 다양한 유사성 검색 쿼리를 사용해 이루어진 서드파티 벤치마크에서 히트웨이브 생성형AI는 스노우플레이크 대비 30배 빠른 속도와 25% 저렴한 비용, 데이터브릭스 대비 15배 빠른 속도와 85% 저렴한 비용, 구글 빅쿼리 대비 18배 빠른 속도와 60% 저렴한 비용을 자랑한다.

별도의 벤치마크에 따르면, pg벡터를 사용하는 아마존 오로라 포스트그레SQL의 벡터 인덱스는 정확도가 떨어져 오답을 산출할 가능성이 있는 것으로 나타났다. 반면 히트웨이브의 유사성 검색 처리는 항상 정확한 결과를 제공하고, 예측 범위 내의 응답 시간을 보장했으며, 유사한 메모리 속도로 수행돼 동일한 수의 코어를 사용하는 아마존 오로라 대비 10배-80배 빠른 속도를 제공한다.

오라클, 히트웨이브 생성형AI 발표…추가비용 無

관련기사

지금 뜨는 기사

이시각 헤드라인

삼성, 구글·퀄컴과 협력·개방성 부각...애플 정조준

[체험] "새벽 3시 2개팀 포기...18개팀 무박 25시간 완주"

빗길부터 돌발 교차로까지 그대로…안전 교육 ‘배민라이더스쿨’ 가보니

AI 추론 시대 핵심 인프라 eSSD...국내 스토리지 생태계 글로벌 공략

ZDNet Power Center