Practical Guidance and Tutorial on Incentivizing Reasoning in LLMs using Distillation and Reinforcement Learning - researchr publication

researchr

You are not signed in
Sign in
Sign up

Zhaopeng Qiu, Jingqi Zhang, Shuang Yu, Shuai Zhang, Junjie Lai. Practical Guidance and Tutorial on Incentivizing Reasoning in LLMs using Distillation and Reinforcement Learning. In Luiza Antonie, Jian Pei 0001, Xiaohui Yu 0001, Flavio Chierichetti, Hady W. Lauw, Yizhou Sun, Srinivasan Parthasarathy 0001, editors, Proceedings of the 31st ACM SIGKDD Conference on Knowledge Discovery and Data Mining, V.2, KDD 2025, Toronto ON, Canada, August 3-7, 2025. pages 6249-6250, ACM, 2025. [doi]

Abstract is missing.

runs on WebDSL