Vision-Text Cross-Modal Fusion for Accurate Video Captioning - researchr publication

researchr

You are not signed in
Sign in
Sign up

Kaouther Ouenniche, Ruxandra Tapu, Titus B. Zaharia. Vision-Text Cross-Modal Fusion for Accurate Video Captioning. IEEE Access, 11:115477-115492, 2023. [doi]

Abstract is missing.

runs on WebDSL