Fusion d'espaces de représentations multimodaux pour la reconnaissance du rôle du locuteur dans des documents télévisuels (Multimodal embedding fusion for robust speaker role recognition in video broadcast )

Sebastien Delecraz, Frédéric Béchet, Benoît Favre, Mickael Rouvier. Fusion d'espaces de représentations multimodaux pour la reconnaissance du rôle du locuteur dans des documents télévisuels (Multimodal embedding fusion for robust speaker role recognition in video broadcast ). In Laurence Danlos, Thierry Hamon, editors, Actes de la conférence conjointe JEP-TALN-RECITAL 2016. Volume 1 : JEP, Paris, France, July 4-8, 2016. pages 364-372, AFCP - ATALA, 2016. [doi]

Authors

Sebastien Delecraz

This author has not been identified. Look up 'Sebastien Delecraz' in Google

Frédéric Béchet

This author has not been identified. Look up 'Frédéric Béchet' in Google

Benoît Favre

This author has not been identified. Look up 'Benoît Favre' in Google

Mickael Rouvier

This author has not been identified. Look up 'Mickael Rouvier' in Google