Finite-Sample Regret Bound for Distributionally Robust Offline Tabular Reinforcement Learning - researchr publication

researchr

You are not signed in
Sign in
Sign up

Zhengqing Zhou, Qinxun Bai, Zhengyuan Zhou, Linhai Qiu, Jose H. Blanchet, Peter W. Glynn. Finite-Sample Regret Bound for Distributionally Robust Offline Tabular Reinforcement Learning. In Arindam Banerjee 0001, Kenji Fukumizu, editors, The 24th International Conference on Artificial Intelligence and Statistics, AISTATS 2021, April 13-15, 2021, Virtual Event. Volume 130 of Proceedings of Machine Learning Research, pages 3331-3339, PMLR, 2021. [doi]

Abstract is missing.

runs on WebDSL