Fusion d'espaces de représentations multimodaux pour la reconnaissance du rôle du locuteur dans des documents télévisuels (Multimodal embedding fusion for robust speaker role recognition in video broadcast )

Sebastien Delecraz, Frédéric Béchet, Benoît Favre, Mickael Rouvier. Fusion d'espaces de représentations multimodaux pour la reconnaissance du rôle du locuteur dans des documents télévisuels (Multimodal embedding fusion for robust speaker role recognition in video broadcast ). In Laurence Danlos, Thierry Hamon, editors, Actes de la conférence conjointe JEP-TALN-RECITAL 2016. Volume 1 : JEP, Paris, France, July 4-8, 2016. pages 364-372, AFCP - ATALA, 2016. [doi]

@inproceedings{DelecrazBFR16,
  title = {Fusion d'espaces de représentations multimodaux pour la reconnaissance du rôle du locuteur dans des documents télévisuels (Multimodal embedding fusion for robust speaker role recognition in video broadcast )},
  author = {Sebastien Delecraz and Frédéric Béchet and Benoît Favre and Mickael Rouvier},
  year = {2016},
  url = {https://www.aclweb.org/anthology/2016.jeptalnrecital-jep.41/},
  researchr = {https://researchr.org/publication/DelecrazBFR16},
  cites = {0},
  citedby = {0},
  pages = {364-372},
  booktitle = {Actes de la conférence conjointe JEP-TALN-RECITAL 2016. Volume 1 : JEP, Paris, France, July 4-8, 2016},
  editor = {Laurence Danlos and Thierry Hamon},
  publisher = {AFCP - ATALA},
}