Importance sampling in reinforcement learning with an estimated behavior policy - researchr publication

researchr

You are not signed in
Sign in
Sign up

Josiah P. Hanna, Scott Niekum, Peter Stone. Importance sampling in reinforcement learning with an estimated behavior policy. Machine Learning, 110(6):1267-1317, 2021. [doi]

Abstract is missing.

runs on WebDSL