Reward Estimation for Variance Reduction in Deep Reinforcement Learning - researchr publication

researchr

You are not signed in
Sign in
Sign up

Joshua Romoff, Alexandre Piché, Peter Henderson 0002, Vincent François-Lavet, Joelle Pineau. Reward Estimation for Variance Reduction in Deep Reinforcement Learning. In 6th International Conference on Learning Representations, ICLR 2018, Vancouver, BC, Canada, April 30 - May 3, 2018, Workshop Track Proceedings. OpenReview.net, 2018. [doi]

Abstract is missing.

runs on WebDSL