Stacked cross-modal feature consolidation attention networks for image captioning - researchr publication

researchr

You are not signed in
Sign in
Sign up

Mozhgan PourKeshavarz, Shahabedin Nabavi, Mohsen Ebrahimi Moghaddam, Mehrnoush Shamsfard. Stacked cross-modal feature consolidation attention networks for image captioning. Multimedia Tools Appl., 83(4):12209-12233, January 2024. [doi]

Abstract is missing.

runs on WebDSL