Direct Large Language Model Alignment Through Self-Rewarding Contrastive Prompt Distillation - researchr publication

researchr

You are not signed in
Sign in
Sign up

Aiwei Liu, Haoping Bai, Zhiyun Lu, Xiang Kong, Xiaoming Wang, Jiulong Shan, Meng Cao, Lijie Wen 0001. Direct Large Language Model Alignment Through Self-Rewarding Contrastive Prompt Distillation. In Lun-Wei Ku, Andre Martins, Vivek Srikumar, editors, Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), ACL 2024, Bangkok, Thailand, August 11-16, 2024. pages 9688-9712, Association for Computational Linguistics, 2024. [doi]

Abstract is missing.

runs on WebDSL