TeaMs-RL: Teaching LLMs to Generate Better Instruction Datasets via Reinforcement Learning

researchr

explore
calendar
search

You are not signed in
Sign in
Sign up

Shangding Gu, Alois Knoll, Ming Jin 0002. TeaMs-RL: Teaching LLMs to Generate Better Instruction Datasets via Reinforcement Learning. Trans. Mach. Learn. Res., 2024, 2024. [doi]

@article{GuK024,
  title = {TeaMs-RL: Teaching LLMs to Generate Better Instruction Datasets via Reinforcement Learning},
  author = {Shangding Gu and Alois Knoll and Ming Jin 0002},
  year = {2024},
  url = {https://openreview.net/forum?id=YmwzfdJPXE},
  researchr = {https://researchr.org/publication/GuK024},
  cites = {0},
  citedby = {0},
  journal = {Trans. Mach. Learn. Res.},
  volume = {2024},
}

External Links

Cite Key

Statistics

PDF

Researchr

TeaMs-RL: Teaching LLMs to Generate Better Instruction Datasets via Reinforcement Learning