Let's Roll a BiFTA: Bi-refinement for Fine-grained Text-visual Alignment in Vision-Language Models - researchr publication

researchr

You are not signed in
Sign in
Sign up

Yuhao Sun, Chengyi Cai, Jiacheng Zhang, Zesheng Ye, Xingliang Yuan, Feng Liu 0003. Let's Roll a BiFTA: Bi-refinement for Fine-grained Text-visual Alignment in Vision-Language Models. Trans. Mach. Learn. Res., 2026, 2026. [doi]

Abstract is missing.

runs on WebDSL