Learning Policies with Zero or Bounded Constraint Violation for Constrained MDPs - researchr publication

researchr

You are not signed in
Sign in
Sign up

Tao Liu 0035, Ruida Zhou, Dileep Kalathil 0001, Panganamala R. Kumar, Chao Tian 0002. Learning Policies with Zero or Bounded Constraint Violation for Constrained MDPs. In Marc'Aurelio Ranzato, Alina Beygelzimer, Yann N. Dauphin, Percy Liang, Jennifer Wortman Vaughan, editors, Advances in Neural Information Processing Systems 34: Annual Conference on Neural Information Processing Systems 2021, NeurIPS 2021, December 6-14, 2021, virtual. pages 17183-17193, 2021. [doi]

Abstract is missing.

runs on WebDSL