ViSTA: Visual Storytelling using Multi-modal Adapters for Text-to-Image Diffusion Models - researchr publication references

researchr

You are not signed in
Sign in
Sign up

Sibo Dong, Ismail Shaheen, Maggie Shen, Rupayan Mallick, Sarah Adel Bargal. ViSTA: Visual Storytelling using Multi-modal Adapters for Text-to-Image Diffusion Models. In IEEE/CVF Winter Conference on Applications of Computer Vision, WACV 2026, Tucson, AZ, USA, March 6-10, 2026. pages 12-21, IEEE, 2026. [doi]

No references recorded for this publication.

No citations of this publication recorded.

runs on WebDSL