Jointly Localizing and Describing Events for Dense Video Captioning - researchr publication related

researchr

You are not signed in
Sign in
Sign up

Yehao Li, Ting Yao, Yingwei Pan, Hongyang Chao, Tao Mei. Jointly Localizing and Describing Events for Dense Video Captioning. In 2018 IEEE Conference on Computer Vision and Pattern Recognition, CVPR 2018, Salt Lake City, UT, USA, June 18-22, 2018. pages 7492-7500, IEEE Computer Society, 2018. [doi]

The following publications are possibly variants of this publication:

Event-Equalized Dense Video CaptioningKangyi Wu, Pengna Li, Jingwen Fu, Yizhe Li, Yang Wu, Yuhan Liu, Jinjun Wang, Sanping Zhou. cvpr 2025: 8417-8427 [doi]

Vote2Cap-DETR++: Decoupling Localization and Describing for End-to-End 3D Dense CaptioningSijin Chen, Hongyuan Zhu, MingSheng Li, Xin Chen 0040, Peng Guo, Yinjie Lei, Gang Yu 0002, Taihao Li, Tao Chen 0003. pami, 46(11):7331-7347, November 2024. [doi]

Event-centric multi-modal fusion method for dense video captioningZhi Chang, Dexin Zhao, Huilin Chen, Jingdan Li, Pengfei Liu. NN, 146:120-129, 2022. [doi]

runs on WebDSL