Off-policy evaluation for tabular reinforcement learning with synthetic trajectories - researchr publication

researchr

You are not signed in
Sign in
Sign up

Weiwei Wang, Yuqiang Li, Xianyi Wu. Off-policy evaluation for tabular reinforcement learning with synthetic trajectories. Statistics and Computing, 34(1):41, February 2024. [doi]

Abstract is missing.

runs on WebDSL