Pessimistic value iteration for multi-task data sharing in Offline Reinforcement Learning - researchr publication authors

researchr

You are not signed in
Sign in
Sign up

Chenjia Bai, Lingxiao Wang 0003, Jianye Hao, Zhuoran Yang, Bin Zhao 0001, Zhen Wang, Xuelong Li 0001. Pessimistic value iteration for multi-task data sharing in Offline Reinforcement Learning. Artificial Intelligence, 326:104048, January 2024. [doi]

This author has not been identified. Look up 'Chenjia Bai' in GoogleThis author has not been identified. Look up 'Lingxiao Wang 0003' in GoogleThis author has not been identified. Look up 'Jianye Hao' in GoogleThis author has not been identified. Look up 'Zhuoran Yang' in GoogleThis author has not been identified. Look up 'Bin Zhao 0001' in GoogleThis author has not been identified. Look up 'Zhen Wang' in GoogleThis author has not been identified. Look up 'Xuelong Li 0001' in Google

runs on WebDSL