Persona Jailbreaking in Large Language Models - researchr publication

researchr

You are not signed in
Sign in
Sign up

Jivnesh Sandhan, Fei Cheng 0002, Tushar Sandhan, Yugo Murawaki. Persona Jailbreaking in Large Language Models. In Vera Demberg, Kentaro Inui, Lluís Marquez, editors, Findings of the Association for Computational Linguistics: EACL 2026, Rabat, Morocco, March 24-29, 2026. pages 1412-1430, Association for Computational Linguistics, 2026. [doi]

Abstract is missing.

runs on WebDSL