A Counterexample on Sample-Path Optimality in Stable Markov Decision Chains with the Average Reward Criterion - researchr publication related

researchr

You are not signed in
Sign in
Sign up

Rolando Cavazos-Cadena, Raúl Montes-De-Oca, Karel Sladký. A Counterexample on Sample-Path Optimality in Stable Markov Decision Chains with the Average Reward Criterion. J. Optimization Theory and Applications, 163(2):674-684, 2014. [doi]

The following publications are possibly variants of this publication:

Sample-Path Optimal Stationary Policies in Stable Markov Decision Chains with the Average Reward CriterionRolando Cavazos-Cadena, Raúl Montes-De-Oca, Karel Sladký. jap, 52(2):419-440, 2015. [doi]

Denumerable controlled Markov chains with average reward criterion: Sample path optimalityRolando Cavazos-Cadena, Emmanuel Fernández-Gaucherand. mmor, 41(1):89-108, 1995. [doi]

Risk-Sensitive Average Optimality in Markov Decision ChainsKarel Sladký, Raúl Montes-De-Oca. or 2008: 69-74 [doi]

runs on WebDSL