Variance-aware Regret Bounds for Stochastic Contextual Dueling Bandits - researchr publication

researchr

You are not signed in
Sign in
Sign up

Qiwei Di, Tao Jin 0002, Yue Wu, Heyang Zhao, Farzad Farnoud, Quanquan Gu. Variance-aware Regret Bounds for Stochastic Contextual Dueling Bandits. In The Twelfth International Conference on Learning Representations, ICLR 2024, Vienna, Austria, May 7-11, 2024. OpenReview.net, 2024. [doi]

Abstract is missing.

runs on WebDSL