VisionLLM: Large Language Model is also an Open-Ended Decoder for Vision-Centric Tasks - researchr publication authors

researchr

You are not signed in
Sign in
Sign up

Wenhai Wang, Zhe Chen, Xiaokang Chen, Jiannan Wu, Xizhou Zhu, Gang Zeng, Ping Luo, Tong Lu, Jie Zhou, Yu Qiao, Jifeng Dai. VisionLLM: Large Language Model is also an Open-Ended Decoder for Vision-Centric Tasks. In Alice Oh, Tristan Naumann, Amir Globerson, Kate Saenko, Moritz Hardt, Sergey Levine, editors, Advances in Neural Information Processing Systems 36: Annual Conference on Neural Information Processing Systems 2023, NeurIPS 2023, New Orleans, LA, USA, December 10 - 16, 2023. 2023. [doi]

This author has not been identified. Look up 'Wenhai Wang' in GoogleThis author has not been identified. Look up 'Zhe Chen' in GoogleThis author has not been identified. Look up 'Xiaokang Chen' in GoogleThis author has not been identified. Look up 'Jiannan Wu' in GoogleThis author has not been identified. Look up 'Xizhou Zhu' in GoogleThis author has not been identified. Look up 'Gang Zeng' in GoogleThis author has not been identified. Look up 'Ping Luo' in GoogleThis author has not been identified. Look up 'Tong Lu' in GoogleThis author has not been identified. Look up 'Jie Zhou' in GoogleThis author has not been identified. Look up 'Yu Qiao' in GoogleThis author has not been identified. Look up 'Jifeng Dai' in Google

runs on WebDSL