Optimistic Posterior Sampling for Reinforcement Learning: Worst-Case Regret Bounds - researchr publication related

researchr

You are not signed in
Sign in
Sign up

Shipra Agrawal 0001, Randy Jia. Optimistic Posterior Sampling for Reinforcement Learning: Worst-Case Regret Bounds. Math. Oper. Res., 48(1):363-392, February 2023. [doi]

The following publications are possibly variants of this publication:

Optimistic posterior sampling for reinforcement learning: worst-case regret boundsShipra Agrawal, Randy Jia. nips 2017: 1184-1194 [doi]

Provably Efficient Exploration in Quantum Reinforcement Learning with Logarithmic Worst-Case RegretHan Zhong 0001, Jiachen Hu, Yecheng Xue, Tongyang Li, Liwei Wang 0001. icml 2024: [doi]

runs on WebDSL