Towards Efficient Resume Understanding: A Multi-Granularity Multi-Modal Pre-Training Approach - researchr publication related

researchr

You are not signed in
Sign in
Sign up

Feihu Jiang, Chuan Qin 0002, Jingshuai Zhang, Kaichun Yao, Xi Chen, Dazhong Shen, Chen Zhu 0003, Hengshu Zhu, Hui Xiong 0001. Towards Efficient Resume Understanding: A Multi-Granularity Multi-Modal Pre-Training Approach. In IEEE International Conference on Multimedia and Expo, ICME 2024, Niagara Falls, ON, Canada, July 15-19, 2024. pages 1-6, IEEE, 2024. [doi]

The following publications are possibly variants of this publication:

ResuFormer: Semantic Structure Understanding for Resumes via Multi-Modal Pre-trainingKaichun Yao, Jingshuai Zhang, Chuan Qin 0002, Xin Song, Peng Wang, Hengshu Zhu, Hui Xiong. icde 2023: 3154-3167 [doi]

LayoutLMv2: Multi-modal Pre-training for Visually-rich Document UnderstandingYang Xu, Yiheng Xu, Tengchao Lv, Lei Cui 0001, Furu Wei, Guoxin Wang, Yijuan Lu, Dinei A. F. Florêncio, Cha Zhang, Wanxiang Che, Min Zhang, Lidong Zhou. acl 2021: 2579-2591 [doi]

MGDoc: Pre-training with Multi-granular Hierarchy for Document Image UnderstandingZilong Wang 0002, Jiuxiang Gu, Chris Tensmeyer, Nikolaos Barmpalios, Ani Nenkova, Tong Sun, Jingbo Shang, Vlad I. Morariu. emnlp 2022: 3984-3993 [doi]

Towards Practical and Efficient Image-to-Speech Captioning with Vision-Language Pre-Training and Multi-Modal TokensMinsu Kim, Jeongsoo Choi, Soumi Maiti, Jeong Hun Yeo, Shinji Watanabe 0001, Yong Man Ro. icassp 2024: 7970-7974 [doi]

Fpcode: an Efficient Approach for Multi-Modal BiometricsLinLin Shen, Li Bai, Zhen Ji. ijprai, 25(2):273-286, 2011. [doi]

runs on WebDSL