SciEval: A Multi-Level Large Language Model Evaluation Benchmark for Scientific Research - researchr publication

researchr

You are not signed in
Sign in
Sign up

Liangtai Sun, Yang Han, Zihan Zhao, Da Ma, Zhennan Shen, Baocai Chen, Lu Chen 0002, Kai Yu 0004. SciEval: A Multi-Level Large Language Model Evaluation Benchmark for Scientific Research. In Michael J. Wooldridge, Jennifer G. Dy, Sriraam Natarajan, editors, Thirty-Eigth AAAI Conference on Artificial Intelligence, AAAI 2024, Thirty-Sixth Conference on Innovative Applications of Artificial Intelligence, IAAI 2024, Fourteenth Symposium on Educational Advances in Artificial Intelligence, EAAI 2014, February 20-27, 2024, Vancouver, Canada. pages 19053-19061, AAAI Press, 2024. [doi]

Abstract is missing.

runs on WebDSL