Reinforcement Learning in Sparse-Reward Environments With Hindsight Policy Gradients - researchr publication

researchr

You are not signed in
Sign in
Sign up

Paulo E. Rauber, Avinash Ummadisingu, Filipe Mutz, Jürgen Schmidhuber. Reinforcement Learning in Sparse-Reward Environments With Hindsight Policy Gradients. Neural Computation, 33(6):1498-1553, 2021. [doi]

Abstract is missing.

runs on WebDSL