Successive Convex Approximation Based Off-Policy Optimization for Constrained Reinforcement Learning - researchr publication

researchr

You are not signed in
Sign in
Sign up

Chang Tian, An Liu 0001, Guan Huang, Wu Luo. Successive Convex Approximation Based Off-Policy Optimization for Constrained Reinforcement Learning. IEEE Transactions on Signal Processing, 70:1609-1624, 2022. [doi]

Abstract is missing.

runs on WebDSL