DiffTED: One-shot Audio-driven TED Talk Video Generation with Diffusion-based Co-speech Gestures - researchr publication related

researchr

You are not signed in
Sign in
Sign up

Steven Hogue, Chenxu Zhang, Hamza Daruger, Yapeng Tian, Xiaohu Guo. DiffTED: One-shot Audio-driven TED Talk Video Generation with Diffusion-based Co-speech Gestures. In IEEE/CVF Conference on Computer Vision and Pattern Recognition, CVPR 2024 - Workshops, Seattle, WA, USA, June 17-18, 2024. pages 1922-1931, IEEE, 2024. [doi]

The following publications are possibly variants of this publication:

DiffuseStyleGesture: Stylized Audio-Driven Co-Speech Gesture Generation with Diffusion ModelsSicheng Yang, Zhiyong Wu 0001, Minglei Li, Zhensong Zhang, Lei Hao, Weihong Bao, Ming Cheng, Long Xiao. IJCAI 2023: 5860-5868 [doi]

Text-Driven Synchronized Diffusion Video and Audio Talking Head GenerationZhenfei Zhang, Tsung-Wei Huang, Guan-Ming Su, Ming-Ching Chang, Xin Li. miproBIS 2024: 61-67 [doi]

Audio-Driven Talking Head Video Generation with Diffusion ModelYizhe Zhu, Chunhui Zhang, Qiong Liu, Xi Zhou. icassp 2023: 1-5 [doi]

Co-Speech Gesture Video Generation via Motion-Decoupled Diffusion ModelXu He, Qiaochu Huang, Zhensong Zhang, Zhiwei Lin, Zhiyong Wu 0001, Sicheng Yang, Minglei Li 0001, Zhiyi Chen, Songcen Xu, Xiaofei Wu. cvpr 2024: 2263-2273 [doi]

Joint Co-Speech Gesture and Expressive Talking Face Generation Using Diffusion with AdaptersSteven Hogue, Chenxu Zhang, Yapeng Tian, Xiaohu Guo. wacv 2025: 4163-4172 [doi]

runs on WebDSL