HQ-CLIP: Leveraging Large Vision-Language Models to Create High-Quality Image-Text Datasets and CLIP Models - researchr publication

researchr

You are not signed in
Sign in
Sign up

Zhixiang Wei, Guangting Wang, Xiaoxiao Ma 0006, Ke Mei, Huaian Chen, Yi Jin 0002, Fengyun Rao. HQ-CLIP: Leveraging Large Vision-Language Models to Create High-Quality Image-Text Datasets and CLIP Models. In IEEE/CVF International Conference on Computer Vision, ICCV 2025, Honolulu, HI, USA, October 19-25, 2025. pages 22447-22456, IEEE, 2025. [doi]

Abstract is missing.

runs on WebDSL