video-SALMONN-o1: Reasoning-enhanced Audio-visual Large Language Model - researchr publication

researchr

You are not signed in
Sign in
Sign up

Guangzhi Sun, Yudong Yang, Jimin Zhuang, Changli Tang, Yixuan Li, Wei Li 0119, Zejun Ma 0001, Chao Zhang 0031. video-SALMONN-o1: Reasoning-enhanced Audio-visual Large Language Model. In Forty-second International Conference on Machine Learning, ICML 2025, Vancouver, BC, Canada, July 13-19, 2025. OpenReview.net, 2025. [doi]

Abstract is missing.

runs on WebDSL