Logarithmic Regret for Episodic Continuous-Time Linear-Quadratic Reinforcement Learning over a Finite-Time Horizon - researchr publication related

researchr

You are not signed in
Sign in
Sign up

Matteo Basei, Xin Guo, Anran Hu, Yufei Zhang. Logarithmic Regret for Episodic Continuous-Time Linear-Quadratic Reinforcement Learning over a Finite-Time Horizon. Journal of Machine Learning Research, 23, 2022. [doi]

The following publications are possibly variants of this publication:

Optimal Scheduling of Entropy Regularizer for Continuous-Time Linear-Quadratic Reinforcement LearningLukasz Szpruch, Tanut Treetanthiploet, Yufei Zhang. siamco, 62(1):135-166, February 2024. [doi]

runs on WebDSL