Efficient Reinforcement Learning from Human Feedback via Bayesian preference inference - researchr publication

researchr

You are not signed in
Sign in
Sign up

Matteo Cercola, Valeria Capretti, Simone Formentin. Efficient Reinforcement Learning from Human Feedback via Bayesian preference inference. IFAC J. Syst. Control., 35:100398, 2026. [doi]

Abstract is missing.

runs on WebDSL