MMICL: Empowering Vision-language Model with Multi-Modal In-Context Learning - researchr publication

researchr

You are not signed in
Sign in
Sign up

Haozhe Zhao, Zefan Cai, Shuzheng Si, Xiaojian Ma, Kaikai An, Liang Chen 0024, Zixuan Liu, Sheng Wang, Wenjuan Han, Baobao Chang. MMICL: Empowering Vision-language Model with Multi-Modal In-Context Learning. In The Twelfth International Conference on Learning Representations, ICLR 2024, Vienna, Austria, May 7-11, 2024. OpenReview.net, 2024. [doi]

Abstract is missing.

runs on WebDSL