The multi-modal fusion in visual question answering: a review of attention mechanisms - researchr publication

researchr

You are not signed in
Sign in
Sign up

Siyu Lu, Mingzhe Liu, Lirong Yin, Zhengtong Yin, Xuan Liu, Wenfeng Zheng. The multi-modal fusion in visual question answering: a review of attention mechanisms. PeerJ Computer Science, 9, 2023. [doi]

Abstract is missing.

runs on WebDSL