시나리오 정리

  • 연구 배경

    • RAG 시스템에서 vectorDB의 낮은 요구사항 요구 latency
    • VectorDB의 indexing 종류
      • IVF, HNSW, DISKANN
      • vector quantazation
    • VectorDB 의 서비스레벨에서 필요 spec
      • HNSW 기준으로 1M vector의 필요한 memory intensive 강조
      • persistent를 위한 잦은 Disk IO
    • 클라우드 서비스의 특성
      • on-premise상의 연구들
        • local NVME 사용
        • 단일 host 실험
      • multi tanent 기반 인프라
        • multi instance 기반 가용성 제공
        • Attachable storage 특성 및 bottleneck
  • 문제 정의 

    • Cloud 환경에서, realtime OLTP vectorDB 탐구
  • 탐구한 접근 방법

    • hnsw 알고리즘의 memory burst issue 해결 방안
    • diskann 알고리즘 확인
      • 상주 메모리 요구가 적음
      • hnsw보다 큰 인덱싱 비용
      • cloud 방에서 disk Latency로 인한 index 처리시간 불리
  • 실험 및 결과

  • 연구 배경

  • 문제 정의 

  • 탐구한 접근 방법

  • 실험 및 결과