Pessimistic value iteration for multi-task data sharing in Offline Reinforcement Learning - researchr publication related

researchr

You are not signed in
Sign in
Sign up

Chenjia Bai, Lingxiao Wang 0003, Jianye Hao, Zhuoran Yang, Bin Zhao 0001, Zhen Wang, Xuelong Li 0001. Pessimistic value iteration for multi-task data sharing in Offline Reinforcement Learning. Artificial Intelligence, 326:104048, January 2024. [doi]

The following publications are possibly variants of this publication:

Offline Constrained Multi-Objective Reinforcement Learning via Pessimistic Dual Value IterationRunzhe Wu, Yufeng Zhang 0007, Zhuoran Yang, Zhaoran Wang. nips 2021: 25439-25451 [doi]

Pessimistic Bootstrapping for Uncertainty-Driven Offline Reinforcement LearningChenjia Bai, Lingxiao Wang 0003, Zhuoran Yang, Zhi-Hong Deng, Animesh Garg, Peng Liu 0008, Zhaoran Wang. iclr 2022: [doi]

Neural Network Approximation for Pessimistic Offline Reinforcement LearningDi Wu, Yuling Jiao, Li Shen, Haizhao Yang, Xiliang Lu. AAAI 2024: 15868-15877 [doi]

Pessimistic Model Selection for Offline Deep Reinforcement LearningChao-Han Huck Yang, Zhengling Qi, Yifan Cui 0001, Pin-Yu Chen. uai 2023: 2379-2389 [doi]

Pessimistic Minimax Value Iteration: Provably Efficient Equilibrium Learning from Offline DatasetsHan Zhong, Wei Xiong, Jiyuan Tan, Liwei Wang, Tong Zhang, Zhaoran Wang, Zhuoran Yang. icml 2022: 27117-27142 [doi]

runs on WebDSL