Learning and Forgetting Unsafe Examples in Large Language Models - researchr publication

researchr

You are not signed in
Sign in
Sign up

Jiachen Zhao, Zhun Deng, David Madras, James Zou 0001, Mengye Ren. Learning and Forgetting Unsafe Examples in Large Language Models. In Forty-first International Conference on Machine Learning, ICML 2024, Vienna, Austria, July 21-27, 2024. pages 60766-60784, OpenReview.net, 2024. [doi]

Abstract is missing.

runs on WebDSL