Text2Reward: Reward Shaping with Language Models for Reinforcement Learning - researchr publication

researchr

You are not signed in
Sign in
Sign up

Tianbao Xie, Siheng Zhao, Chen Henry Wu, Yitao Liu, Qian Luo, Victor Zhong, Yanchao Yang, Tao Yu 0009. Text2Reward: Reward Shaping with Language Models for Reinforcement Learning. In The Twelfth International Conference on Learning Representations, ICLR 2024, Vienna, Austria, May 7-11, 2024. OpenReview.net, 2024. [doi]

Abstract is missing.

runs on WebDSL