시나리오 정리
-
연구 배경
- RAG 시스템에서 vectorDB의 낮은 요구사항 요구 latency
- VectorDB의 indexing 종류
- IVF, HNSW, DISKANN
- vector quantazation
- VectorDB 의 서비스레벨에서 필요 spec
- HNSW 기준으로 1M vector의 필요한 memory intensive 강조
- persistent를 위한 잦은 Disk IO
- 클라우드 서비스의 특성
- on-premise상의 연구들
- local NVME 사용
- 단일 host 실험
- multi tanent 기반 인프라
- multi instance 기반 가용성 제공
- Attachable storage 특성 및 bottleneck
- on-premise상의 연구들
-
문제 정의
- Cloud 환경에서, realtime OLTP vectorDB 탐구
-
탐구한 접근 방법
- hnsw 알고리즘의 memory burst issue 해결 방안
- diskann 알고리즘 확인
- 상주 메모리 요구가 적음
- hnsw보다 큰 인덱싱 비용
- cloud 방에서 disk Latency로 인한 index 처리시간 불리
-
실험 및 결과
-
연구 배경
-
문제 정의
-
탐구한 접근 방법
-
실험 및 결과