Real-time VAD-less Speech Recognition by Fine-tuning SSL Model with Data Containing Tagged Non-speech Segments - researchr publication

researchr

You are not signed in
Sign in
Sign up

Jotaro Emoto, Ryota Nishimura, Kengo Ohta, Norihide Kitaoka. Real-time VAD-less Speech Recognition by Fine-tuning SSL Model with Data Containing Tagged Non-speech Segments. In Asia Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA ASC 2025, Singapore, October 22-24, 2025. pages 980-985, IEEE, 2025. [doi]

Abstract is missing.

runs on WebDSL