A Counterexample on Sample-Path Optimality in Stable Markov Decision Chains with the Average Reward Criterion - researchr publication

researchr

You are not signed in
Sign in
Sign up

Rolando Cavazos-Cadena, Raúl Montes-De-Oca, Karel Sladký. A Counterexample on Sample-Path Optimality in Stable Markov Decision Chains with the Average Reward Criterion. J. Optimization Theory and Applications, 163(2):674-684, 2014. [doi]

Abstract is missing.

runs on WebDSL