Policy Optimization as Online Learning with Mediator Feedback - researchr publication

researchr

You are not signed in
Sign in
Sign up

Alberto Maria Metelli, Matteo Papini, Pierluca D'Oro, Marcello Restelli. Policy Optimization as Online Learning with Mediator Feedback. In Thirty-Fifth AAAI Conference on Artificial Intelligence, AAAI 2021, Thirty-Third Conference on Innovative Applications of Artificial Intelligence, IAAI 2021, The Eleventh Symposium on Educational Advances in Artificial Intelligence, EAAI 2021, Virtual Event, February 2-9, 2021. pages 8958-8966, AAAI Press, 2021. [doi]

Abstract is missing.

runs on WebDSL