Multimodal architecture for video captioning with memory networks and an attention mechanism - researchr publication related

researchr

You are not signed in
Sign in
Sign up

Wei Li, Dashan Guo, Xiangzhong Fang. Multimodal architecture for video captioning with memory networks and an attention mechanism. Pattern Recognition Letters, 105:23-29, 2018. [doi]

The following publications are possibly variants of this publication:

Multimodal Semantic Attention Network for Video CaptioningLiang Sun, Bing Li, Chunfeng Yuan, Zhengjun Zha, Weiming Hu. icmcs 2019: 1300-1305 [doi]

Hierarchical & multimodal video captioning: Discovering and transferring multimodal knowledge for vision to languageAn-An Liu, Ning Xu, Yongkang Wong, Junnan Li, Yuting Su, Mohan S. Kankanhalli. cviu, 163:113-125, 2017. [doi]

runs on WebDSL