How to Evaluate Reward Models for RLHF - researchr publication authors

researchr

You are not signed in
Sign in
Sign up

Evan Frick, Tianle Li, Connor Chen, Wei-Lin Chiang, Anastasios Nikolas Angelopoulos, Jiantao Jiao, Banghua Zhu, Joseph E. Gonzalez, Ion Stoica. How to Evaluate Reward Models for RLHF. In The Thirteenth International Conference on Learning Representations, ICLR 2025, Singapore, April 24-28, 2025. OpenReview.net, 2025. [doi]

This author has not been identified. Look up 'Evan Frick' in GoogleThis author has not been identified. Look up 'Tianle Li' in GoogleThis author has not been identified. Look up 'Connor Chen' in GoogleThis author has not been identified. Look up 'Wei-Lin Chiang' in GoogleThis author has not been identified. Look up 'Anastasios Nikolas Angelopoulos' in GoogleThis author has not been identified. Look up 'Jiantao Jiao' in GoogleThis author has not been identified. Look up 'Banghua Zhu' in GoogleThis author has not been identified. Look up 'Joseph E. Gonzalez' in GoogleThis author has not been identified. Look up 'Ion Stoica' in Google

runs on WebDSL