Guarded Policy Optimization with Imperfect Online Demonstrations - researchr publication

researchr

You are not signed in
Sign in
Sign up

Zhenghai Xue, Zhenghao Peng, Quanyi Li, Zhihan Liu, Bolei Zhou. Guarded Policy Optimization with Imperfect Online Demonstrations. In The Eleventh International Conference on Learning Representations, ICLR 2023, Kigali, Rwanda, May 1-5, 2023. OpenReview.net, 2023. [doi]

Abstract is missing.

runs on WebDSL