Learning Optimal Policies in Markov Decision Processes with Value Function Discovery? - researchr publication

researchr

You are not signed in
Sign in
Sign up

Martijn Onderwater, Sandjai Bhulai, Rob van der Mei. Learning Optimal Policies in Markov Decision Processes with Value Function Discovery?. SIGMETRICS Performance Evaluation Review, 43(2):7-9, 2015. [doi]

Abstract is missing.

runs on WebDSL