Consistent multimodal pre-training for visual tokenization - researchr publication

researchr

You are not signed in
Sign in
Sign up

Ting Pan, Lulu Tang, Xinlong Wang, Xin Liu 0044, Shiguang Shan. Consistent multimodal pre-training for visual tokenization. Science in China Series F: Information Sciences, 68(10), 2025. [doi]

Abstract is missing.

runs on WebDSL