VectorLiteRAG: Latency-Aware and Fine-Grained Resource Partitioning for Efficient RAG - researchr publication

researchr

You are not signed in
Sign in
Sign up

Junkyum Kim, Divya Mahajan 0001. VectorLiteRAG: Latency-Aware and Fine-Grained Resource Partitioning for Efficient RAG. In IEEE International Symposium on High Performance Computer Architecture, HPCA 2026, Sydney, Australia, January 31 - Feb. 4, 2026. pages 1-15, IEEE, 2026. [doi]

Abstract is missing.

runs on WebDSL