Food-500 Cap: A Fine-Grained Food Caption Benchmark for Evaluating Vision-Language Models - researchr publication

researchr

You are not signed in
Sign in
Sign up

Zheng Ma, Mianzhi Pan, Wenhan Wu, Kanzhi Cheng, Jianbing Zhang, Shujian Huang, Jiajun Chen. Food-500 Cap: A Fine-Grained Food Caption Benchmark for Evaluating Vision-Language Models. In Abdulmotaleb El-Saddik, Tao Mei, Rita Cucchiara, Marco Bertini 0001, Diana Patricia Tobon Vallejo, Pradeep K. Atrey, M. Shamim Hossain, editors, Proceedings of the 31st ACM International Conference on Multimedia, MM 2023, Ottawa, ON, Canada, 29 October 2023- 3 November 2023. pages 5674-5685, ACM, 2023. [doi]

Abstract is missing.

runs on WebDSL