Deconstructing What Makes a Good Optimizer for Autoregressive Language Models - researchr publication

researchr

You are not signed in
Sign in
Sign up

Rosie Zhao, Depen Morwani, David Brandfonbrener, Nikhil Vyas 0001, Sham M. Kakade. Deconstructing What Makes a Good Optimizer for Autoregressive Language Models. In The Thirteenth International Conference on Learning Representations, ICLR 2025, Singapore, April 24-28, 2025. OpenReview.net, 2025. [doi]

Abstract is missing.

runs on WebDSL