VITR: Augmenting Vision Transformers with Relation-Focused Learning for Cross-modal Information Retrieval - researchr publication

researchr

You are not signed in
Sign in
Sign up

Yan Gong, Georgina Cosma, Axel Finke. VITR: Augmenting Vision Transformers with Relation-Focused Learning for Cross-modal Information Retrieval. TKDD, 18(9), November 2024. [doi]

Abstract is missing.

runs on WebDSL