Prioritized Experience Replay based on Multi-armed Bandit - researchr publication related

researchr

You are not signed in
Sign in
Sign up

Ximing Liu, Tianqing Zhu, Cuiqing Jiang, Dayong Ye, Fuqing Zhao. Prioritized Experience Replay based on Multi-armed Bandit. Expert Syst. Appl., 189:116023, 2022. [doi]

The following publications are possibly variants of this publication:

Deep Deterministic Policy Gradient Based on Double Network Prioritized Experience ReplayChaohai Kang, Chuiting Rong, Weijian Ren, Fengcai Huo, Pengyun Liu. access, 9:60296-60308, 2021. [doi]

Strategy Generation Based on DDPG with Prioritized Experience Replay for UCAVJunsen Lu, Yun-Bo Zhao, Yu Kang, Yuhui Wang, Yimin Deng. icarm 2022: 157-162 [doi]

runs on WebDSL