Audio-Visual Fusion Framework for Low-Resource Language Speech Recognition Based on Progressive Down-Sampling and Grouped Multi-Heads Attention Mechanism - researchr publication

researchr

You are not signed in
Sign in
Sign up

Chongchong Yu, Xiaolong Xu, Zhaopeng Qian, Kejing Xiao, Yuchen Tan. Audio-Visual Fusion Framework for Low-Resource Language Speech Recognition Based on Progressive Down-Sampling and Grouped Multi-Heads Attention Mechanism. In Asia Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA ASC 2025, Singapore, October 22-24, 2025. pages 1332-1337, IEEE, 2025. [doi]

Abstract is missing.

runs on WebDSL