Layer-wise enhanced transformer with multi-modal fusion for image caption - researchr publication

researchr

You are not signed in
Sign in
Sign up

Jingdan Li, Yi Wang, Dexin Zhao. Layer-wise enhanced transformer with multi-modal fusion for image caption. Multimedia Syst., 29(3):1043-1056, June 2023. [doi]

Abstract is missing.

runs on WebDSL