Multi-Modal Video Summarization Based on Two-Stage Fusion of Audio, Visual, and Recognized Text Information - researchr publication authors

researchr

You are not signed in
Sign in
Sign up

Zekun Yang, Jiajun He, Tomoki Toda. Multi-Modal Video Summarization Based on Two-Stage Fusion of Audio, Visual, and Recognized Text Information. In Asia Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA ASC 2024, Macau, December 3-6, 2024. pages 1-6, IEEE, 2024. [doi]

This author has not been identified. Look up 'Zekun Yang' in GoogleThis author has not been identified. Look up 'Jiajun He' in GoogleThis author has not been identified. Look up 'Tomoki Toda' in Google

runs on WebDSL