SeaPO: Strategic Error Amplification for Robust Preference Optimization of Large Language Models - researchr publication

researchr

You are not signed in
Sign in
Sign up

Jun Rao, Yunjie Liao, Xuebo Liu 0002, Zepeng Lin, Lian-lian, Dong Jin, Shengjun Cheng, Jun Yu 0002, Min Zhang 0005. SeaPO: Strategic Error Amplification for Robust Preference Optimization of Large Language Models. In Christos Christodoulopoulos 0001, Tanmoy Chakraborty 0002, Carolyn Rose, Violet Peng, editors, Findings of the Association for Computational Linguistics: EMNLP 2025, Suzhou, China, November 4-9, 2025. pages 16540-16557, Association for Computational Linguistics, 2025. [doi]

Abstract is missing.

runs on WebDSL