Learning to Better Search with Language Models via Guided Reinforced Self-Training - researchr publication authors

researchr

You are not signed in
Sign in
Sign up

Seungyong Moon, Bumsoo Park, Hyun Oh Song. Learning to Better Search with Language Models via Guided Reinforced Self-Training. In Danielle Belgrave, Cheng Zhang 0005, Laura N. Montoya, Hsuan-Tien Lin, Razvan Pascanu, Piotr Koniusz, Marzyeh Ghassemi, Nancy Chen, Iván Vladimir Meza Ruíz, Arturo Loaiza-Bonilla, editors, Advances in Neural Information Processing Systems 38: Annual Conference on Neural Information Processing Systems 2025, NeurIPS 2025, San Diago, CA, USA, December 2-7, 2025 / Mexico City, Mexico, November 30 - December 5, 2025. 2025. [doi]

This author has not been identified. Look up 'Seungyong Moon' in GoogleThis author has not been identified. Look up 'Bumsoo Park' in GoogleThis author has not been identified. Look up 'Hyun Oh Song' in Google

runs on WebDSL