Adaptive computation of optimal nonrandomized policies in constrained average-reward MDPs - researchr publication

researchr

You are not signed in
Sign in
Sign up

Eugene A. Feinberg. Adaptive computation of optimal nonrandomized policies in constrained average-reward MDPs. In IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning, ADPRL 2009, Nashville, TN, USA, March 31 - April 1, 2009. pages 96-100, IEEE, 2009. [doi]

Abstract is missing.

runs on WebDSL