Reward estimation with scheduled knowledge distillation for dialogue policy learning - researchr publication reviews

researchr

You are not signed in
Sign in
Sign up

Junyan Qiu, Haidong Zhang, Yiping Yang. Reward estimation with scheduled knowledge distillation for dialogue policy learning. Connect. Sci., 35(1), December 2023. [doi]

No reviews for this publication, yet.

runs on WebDSL