Evaluating Mathematical Reasoning of Large Language Models: A Focus on Error Identification and Correction

researchr

You are not signed in
Sign in
Sign up

Xiaoyuan Li, Wenjie Wang 0007, Moxin Li, Junrong Guo, Yang Zhang 0072, Fuli Feng. Evaluating Mathematical Reasoning of Large Language Models: A Focus on Error Identification and Correction. In Lun-Wei Ku, Andre Martins, Vivek Srikumar, editors, Findings of the Association for Computational Linguistics, ACL 2024, Bangkok, Thailand and virtual meeting, August 11-16, 2024. pages 11316-11360, Association for Computational Linguistics, 2024. [doi]

@inproceedings{Li0LG0F24,
  title = {Evaluating Mathematical Reasoning of Large Language Models: A Focus on Error Identification and Correction},
  author = {Xiaoyuan Li and Wenjie Wang 0007 and Moxin Li and Junrong Guo and Yang Zhang 0072 and Fuli Feng},
  year = {2024},
  url = {https://aclanthology.org/2024.findings-acl.673},
  researchr = {https://researchr.org/publication/Li0LG0F24},
  cites = {0},
  citedby = {0},
  pages = {11316-11360},
  booktitle = {Findings of the Association for Computational Linguistics, ACL 2024, Bangkok, Thailand and virtual meeting, August 11-16, 2024},
  editor = {Lun-Wei Ku and Andre Martins and Vivek Srikumar},
  publisher = {Association for Computational Linguistics},
  isbn = {979-8-89176-099-8},
}

External Links

Cite Key

Statistics

PDF

Researchr

Evaluating Mathematical Reasoning of Large Language Models: A Focus on Error Identification and Correction