Pessimistic Q-Learning for Offline Reinforcement Learning: Towards Optimal Sample Complexity - researchr publication

researchr

You are not signed in
Sign in
Sign up

Laixi Shi, Gen Li 0005, Yuting Wei, Yuxin Chen 0002, Yuejie Chi. Pessimistic Q-Learning for Offline Reinforcement Learning: Towards Optimal Sample Complexity. In Kamalika Chaudhuri, Stefanie Jegelka, Le Song, Csaba Szepesvári, Gang Niu 0001, Sivan Sabato, editors, International Conference on Machine Learning, ICML 2022, 17-23 July 2022, Baltimore, Maryland, USA. Volume 162 of Proceedings of Machine Learning Research, pages 19967-20025, PMLR, 2022. [doi]

Abstract is missing.

runs on WebDSL