Les modèles de langue contextuels Camembert pour le français : impact de la taille et de l'hétérogénéité des données d'entrainement (C AMEM BERT Contextual Language Models for French: Impact of Training Data Size and Heterogeneity )

Louis Martin, Benjamin Müller, Pedro Javier Ortiz Suárez, Yoann Dupont, Laurent Romary, Éric Villemonte de la Clergerie, Benoît Sagot, Djamé Seddah. Les modèles de langue contextuels Camembert pour le français : impact de la taille et de l'hétérogénéité des données d'entrainement (C AMEM BERT Contextual Language Models for French: Impact of Training Data Size and Heterogeneity ). In Christophe Benzitoun, Chloé Braud, Laurine Huber, David Langlois, Slim Ouni, Sylvain Pogodalla, Stéphane Schneider, editors, Actes de la 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 2 : Traitement Automatique des Langues Naturelle, Nancy, France, June 8-19, 2020. pages 54-65, ATALA et AFCP, 2020. [doi]

Authors

Louis Martin

This author has not been identified. Look up 'Louis Martin' in Google

Benjamin Müller

This author has not been identified. Look up 'Benjamin Müller' in Google

Pedro Javier Ortiz Suárez

This author has not been identified. Look up 'Pedro Javier Ortiz Suárez' in Google

Yoann Dupont

This author has not been identified. Look up 'Yoann Dupont' in Google

Laurent Romary

This author has not been identified. Look up 'Laurent Romary' in Google

Éric Villemonte de la Clergerie

This author has not been identified. Look up 'Éric Villemonte de la Clergerie' in Google

Benoît Sagot

This author has not been identified. Look up 'Benoît Sagot' in Google

Djamé Seddah

This author has not been identified. Look up 'Djamé Seddah' in Google