Unifying 3D Vision-Language Understanding via Promptable Queries - researchr publication related

researchr

You are not signed in
Sign in
Sign up

Ziyu Zhu, Zhuofan Zhang, Xiaojian Ma, Xuesong Niu, Yixin Chen 0003, Baoxiong Jia, Zhidong Deng, Siyuan Huang 0001, Qing Li 0003. Unifying 3D Vision-Language Understanding via Promptable Queries. In Ales Leonardis, Elisa Ricci 0001, Stefan Roth 0001, Olga Russakovsky, Torsten Sattler, Gül Varol, editors, Computer Vision - ECCV 2024 - 18th European Conference, Milan, Italy, September 29-October 4, 2024, Proceedings, Part XLIV. Volume 15102 of Lecture Notes in Computer Science, pages 188-206, Springer, 2024. [doi]

The following publications are possibly variants of this publication:

A Unified Framework for Multi-Intent Spoken Language Understanding with PromptingFeifan Song 0001, Lianzhe Huang, Houfeng Wang. icassp 2024: 9966-9970 [doi]

UniDCP: Unifying Multiple Medical Vision-Language Tasks via Dynamic Cross-Modal Learnable PromptsChenlu Zhan, Yufei Zhang 0015, Yu Lin, Gaoang Wang, Hongwei Wang 0001. tmm, 26:9736-9748, 2024. [doi]

A Unified Generative Retriever for Knowledge-Intensive Language Tasks via Prompt LearningJiangui Chen, Ruqing Zhang 0001, Jiafeng Guo, Maarten de Rijke, Yiqun Liu 0001, Yixing Fan, Xueqi Cheng. sigir 2023: 1448-1457 [doi]

GLIPv2: Unifying Localization and Vision-Language UnderstandingHaotian Zhang, Pengchuan Zhang, Xiaowei Hu 0006, Yen-Chun Chen 0001, Liunian Harold Li, Xiyang Dai, Lijuan Wang, Lu Yuan, Jenq-Neng Hwang, Jianfeng Gao. nips 2022: [doi]

UniVS: Unified and Universal Video Segmentation with Prompts as QueriesMinghan Li, Shuai Li, Xindong Zhang, Lei Zhang. cvpr 2024: 3227-3238 [doi]

runs on WebDSL