TCRA-LLM: Token Compression Retrieval Augmented Large Language Model for Inference Cost Reduction - researchr publication authors

researchr

You are not signed in
Sign in
Sign up

Junyi Liu, LiangZhi Li, Tong Xiang, Bowen Wang, Yiming Qian. TCRA-LLM: Token Compression Retrieval Augmented Large Language Model for Inference Cost Reduction. In Houda Bouamor, Juan Pino 0001, Kalika Bali, editors, Findings of the Association for Computational Linguistics: EMNLP 2023, Singapore, December 6-10, 2023. pages 9796-9810, Association for Computational Linguistics, 2023. [doi]

This author has not been identified. Look up 'Junyi Liu' in GoogleThis author has not been identified. Look up 'LiangZhi Li' in GoogleThis author has not been identified. Look up 'Tong Xiang' in GoogleThis author has not been identified. Look up 'Bowen Wang' in GoogleThis author has not been identified. Look up 'Yiming Qian' in Google

runs on WebDSL