Grounding Language Models to Images for Multimodal Inputs and Outputs - researchr publication

researchr

You are not signed in
Sign in
Sign up

Jing Yu Koh, Ruslan Salakhutdinov, Daniel Fried. Grounding Language Models to Images for Multimodal Inputs and Outputs. In Andreas Krause 0001, Emma Brunskill, KyungHyun Cho, Barbara Engelhardt, Sivan Sabato, Jonathan Scarlett, editors, International Conference on Machine Learning, ICML 2023, 23-29 July 2023, Honolulu, Hawaii, USA. Volume 202 of Proceedings of Machine Learning Research, pages 17283-17300, PMLR, 2023. [doi]

Abstract is missing.

runs on WebDSL