A Generalized Projected Bellman Error for Off-policy Value Estimation in Reinforcement Learning - researchr publication

researchr

You are not signed in
Sign in
Sign up

Andrew Patterson, Adam White 0001, Martha White. A Generalized Projected Bellman Error for Off-policy Value Estimation in Reinforcement Learning. Journal of Machine Learning Research, 23, 2022. [doi]

Abstract is missing.

runs on WebDSL