TeaMs-RL: Teaching LLMs to Generate Better Instruction Datasets via Reinforcement Learning - researchr publication references

researchr

You are not signed in
Sign in
Sign up

Shangding Gu, Alois Knoll, Ming Jin 0002. TeaMs-RL: Teaching LLMs to Generate Better Instruction Datasets via Reinforcement Learning. Trans. Mach. Learn. Res., 2024, 2024. [doi]

No references recorded for this publication.

No citations of this publication recorded.

runs on WebDSL