Reward-Weighted Regression with Sample Reuse for Direct Policy Search in Reinforcement Learning - researchr publication

researchr

You are not signed in
Sign in
Sign up

Hirotaka Hachiya, Jan Peters, Masashi Sugiyama. Reward-Weighted Regression with Sample Reuse for Direct Policy Search in Reinforcement Learning. Neural Computation, 23(11):2798-2832, 2011. [doi]

Abstract is missing.

runs on WebDSL