Document

❯

❯

❯

❯

최종 발표

2026년 7월 13일2 min read

시나리오 정리

연구 배경
- RAG 시스템에서 vectorDB의 낮은 요구사항 요구 latency
- VectorDB의 indexing 종류
  - IVF, HNSW, DISKANN
  - vector quantazation
- VectorDB 의 서비스레벨에서 필요 spec
  - HNSW 기준으로 1M vector의 필요한 memory intensive 강조
  - persistent를 위한 잦은 Disk IO
- 클라우드 서비스의 특성
  - on-premise상의 연구들
    - local NVME 사용
    - 단일 host 실험
  - multi tanent 기반 인프라
    - multi instance 기반 가용성 제공
    - Attachable storage 특성 및 bottleneck
문제 정의
- Cloud 환경에서, realtime OLTP vectorDB 탐구
탐구한 접근 방법
- hnsw 알고리즘의 memory burst issue 해결 방안
- diskann 알고리즘 확인
  - 상주 메모리 요구가 적음
  - hnsw보다 큰 인덱싱 비용
  - cloud 방에서 disk Latency로 인한 index 처리시간 불리
실험 및 결과
연구 배경
문제 정의
탐구한 접근 방법
실험 및 결과

그래프 뷰

Created with Quartz v4.5.0 © 2026

GitHub
Discord Community