MMFT-BERT: Multimodal Fusion Transformer with BERT Encodings for Visual Question Answering - researchr publication

researchr

You are not signed in
Sign in
Sign up

Aisha Urooj Khan, Amir Mazaheri, Niels da Vitoria Lobo, Mubarak Shah. MMFT-BERT: Multimodal Fusion Transformer with BERT Encodings for Visual Question Answering. In Trevor Cohn, Yulan He, Yang Liu, editors, Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing: Findings, EMNLP 2020, Online Event, 16-20 November 2020. pages 4648-4660, Association for Computational Linguistics, 2020. [doi]

Abstract is missing.

runs on WebDSL