StrucTexTv2: Masked Visual-Textual Prediction for Document Image Pre-training - researchr publication

researchr

You are not signed in
Sign in
Sign up

Yuechen Yu, Yulin Li, Chengquan Zhang, Xiaoqiang Zhang, Zengyuan Guo, Xiameng Qin, Kun Yao, Junyu Han, Errui Ding, Jingdong Wang 0001. StrucTexTv2: Masked Visual-Textual Prediction for Document Image Pre-training. In The Eleventh International Conference on Learning Representations, ICLR 2023, Kigali, Rwanda, May 1-5, 2023. OpenReview.net, 2023. [doi]

Abstract is missing.

runs on WebDSL