Combining policy gradient and Q-learning - researchr publication

researchr

You are not signed in
Sign in
Sign up

Brendan O'Donoghue, Rémi Munos, Koray Kavukcuoglu, Volodymyr Mnih. Combining policy gradient and Q-learning. In 5th International Conference on Learning Representations, ICLR 2017, Toulon, France, April 24-26, 2017, Conference Track Proceedings. OpenReview.net, 2017. [doi]

Abstract is missing.

runs on WebDSL