Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC-2014), Reykjavik, Iceland, May 26-31, 2014

researchr

You are not signed in
Sign in
Sign up

Nicoletta Calzolari, Khalid Choukri, Thierry Declerck, Hrafn Loftsson, Bente Maegaard, Joseph Mariani, Asunción Moreno, Jan Odijk, Stelios Piperidis, editors, Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC-2014), Reykjavik, Iceland, May 26-31, 2014. European Language Resources Association (ELRA), 2014. [doi]

Conference: lrec2014

Abstract is missing.

The Alveo Virtual Laboratory: A Web Based Repository APISteve Cassidy, Dominique Estival, Timothy Jones 0001, Denis Burnham, Jared Burghold. 1-7 [doi]

A stream computing approach towards scalable NLPXabier Artola, Zuhaitz Beloki, Aitor Soroa. 8-13 [doi]

ILLINOISCLOUDNLP: Text Analytics Services in the CloudHao Wu, Zhiye Fei, Aaron Dai, Mark Sammons, Dan Roth, Stephen D. Mayhew. 14-21 [doi]

The Language Application GridNancy Ide, James Pustejovsky, Christopher Cieri, Eric Nyberg, Di Wang, Keith Suderman, Marc Verhagen, Jonathan Wright. 22-30 [doi]

Praaline: Integrating Tools for Speech Corpus ResearchGeorge Christodoulides. 31-34 [doi]

Linguistic Evaluation of Support Verb Constructions by OpenLogos and Google TranslateAnabela Barreiro, Johanna Monti, Brigitte Orliac, Susanne Preuß, Kutz Arrieta, Wang Ling, Fernando Batista, Isabel Trancoso. 35-40 [doi]

MTWatch: A Tool for the Analysis of Noisy Parallel DataSandipan Dandapat, Declan Groves. 41-45 [doi]

Machine Translation for Subtitling: A Large-Scale EvaluationThierry Etchegoyhen, Lindsay Bywood, Mark Fishel, Panayota Georgakopoulou, Jie Jiang, Gerard van Loenhout, Arantza del Pozo, Mirjam Sepesy Maucec, Anja Turner, Martin Volk. 46-53 [doi]

Machine Translationness: Machine-likeness in Machine Translation EvaluationJoaquim Moré, Salvador Climent. 54-61 [doi]

On the origin of errors: A fine-grained analysis of MT and PE errors and their relationshipJoke Daems, Lieve Macken, Sonia Vandepitte. 62-66 [doi]

Parsing Chinese Synthetic Words with a Character-based Dependency ModelFei Cheng, Kevin Duh, Yuji Matsumoto. 67-72 [doi]

Improvements to Dependency Parsing Using Automatic Simplification of DataTomás Jelínek. 73-77 [doi]

All Fragments Count in Parser EvaluationJoost Bastings, Khalil Sima'an. 78-82 [doi]

Less is More? Towards a Reduced Inventory of Categories for Training a Parser for the Italian Stanford DependenciesMaria Simi, Cristina Bosco, Simonetta Montemagni. 83-90 [doi]

Rapid Deployment of Phrase Structure Parsing for Related Languages: A Case Study of Insular ScandinavianAnton Karl Ingason, Hrafn Loftsson, Eiríkur Rögnvaldsson, Einar Freyr Sigurðsson, Joel Wallenberg. 91-95 [doi]

Boosting Open Information Extraction with Noun-Based RelationsClarissa Castellã Xavier, Vera Lúcia Strube de Lima. 96-100 [doi]

Clinical Data-Driven Probabilistic Graph ProcessingTravis Goodwin, Sanda M. Harabagiu. 101-108 [doi]

A Framework for Compiling High Quality Knowledge Resources From Raw CorporaGongye Jin, Daisuke Kawahara, Sadao Kurohashi. 109-114 [doi]

Thematic Cohesion: measuring terms discriminatory power toward themesClément de Groc, Xavier Tannier, Claude de Loupy. 115-119 [doi]

Extracting Information for Context-aware Meeting PreparationSimon Scerri, Behrang Q. Zadeh, Maciej Dabrowski, Ismael Rivera. 120-124 [doi]

TaLAPi ― A Thai Linguistically Annotated Corpus for Language ProcessingAiTi Aw, Sharifah Aljunied Mahani, Nattadaporn Lertcheva, Sasiwimon Kalunsima. 125-132 [doi]

Variations on quantitative comparability measures and their evaluations on synthetic French-English comparable corporaGuiyao Ke, Pierre-François Marteau, Gildas Ménier. 133-139 [doi]

Using Transfer Learning to Assist Exploratory Corpus AnnotationPaul Felt, Eric K. Ringger, Kevin D. Seppi, Kristian Heal. 140-145 [doi]

Priberam Compressive Summarization Corpus: A New Multi-Document Summarization Corpus for European PortugueseMiguel B. Almeida, Mariana S. C. Almeida, André F. T. Martins, Helena Figueira, Pedro Mendes, Cláudia Pinto. 146-152 [doi]

Corpus and Evaluation of Handwriting Recognition of Historical Genealogical RecordsPatrick Schone, Heath E. Nielson, Mark Ward. 153-159 [doi]

The SYN-series corpora of written CzechMilena Hnátková, Michal Kren, Pavel Procházka, Hana Skoumalová. 160-164 [doi]

Corpus of 19th-century Czech Texts: Problems and SolutionsKarel Kucera, Martin Stluka. 165-168 [doi]

Extending standoff annotationMaik Stührenberg. 169-174 [doi]

Constructing and exploiting an automatically annotated resource of legislative textsStefan Höfler, Kyoko Sugisaki. 175-180 [doi]

A Study on Expert Sourcing Enterprise Question Collection and ClassificationYuan Luo, Thomas F. Boucher, Tolga Oral, David Osofsky, Sara Weber. 181-188 [doi]

Can the Crowd be Controlled?: A Case Study on Crowd Sourcing and Automatic Validation of Completed Tasks based on User ModelingBalamurali A. R. 189-195 [doi]

When Transliteration Met Crowdsourcing : An Empirical Study of Transliteration via Crowdsourcing using Efficient, Non-redundant and Fair Quality ControlMitesh M. Khapra, Ananthakrishnan Ramanathan, Anoop Kunchukuttan, Karthik Visweswariah, Pushpak Bhattacharyya. 196-202 [doi]

Design and Development of an Online Computational Framework to Facilitate Language Comprehension Research on Indian LanguagesManjira Sinha, Tirthankar Dasgupta, Anupam Basu. 203-210 [doi]

Collaboration in the Production of a Massively Multilingual LexiconMartin Benjamin. 211-215 [doi]

A SICK cure for the evaluation of compositional distributional semantic modelsMarco Marelli, Stefano Menini, Marco Baroni, Luisa Bentivogli, Raffaella Bernardi, Roberto Zamparelli. 216-223 [doi]

Can Crowdsourcing be used for Effective Annotation of Arabic?Wajdi Zaghouani, Kais Dukes. 224-228 [doi]

Crowdsourcing as a preprocessing for complex semantic annotation tasksHéctor Martínez Alonso, Lauren Romeo. 229-234 [doi]

Online experiments with the Percy software framework - experiences and some early resultsChristoph Draxler. 235-240 [doi]

A Multi-Dialect, Multi-Genre Corpus of Informal Written ArabicRyan Cotterell, Chris Callison-Burch. 241-245 [doi]

First Insight into Quality-Adaptive DialogueStefan Ultes, Hüseyin Dikme, Wolfgang Minker. 246-251 [doi]

The DBOX Corpus Collection of Spoken Human-Human and Human-Machine DialoguesVolha Petukhova, Martin Gropp, Dietrich Klakow, Gregor Eigner, Mario Topf, Stefan Srb, Petr Motlícek, Blaise Potard, John Dines, Olivier Deroo, Ronny Egeler, Uwe Meinz, Steffen Liersch, Anna Schmidt. 252-258 [doi]

Modeling and evaluating dialog success in the LAST MINUTE corpusDietmar Rösner, Rafael Friesen, Stephan Günther, Rico Andrich. 259-265 [doi]

NASTIA: Negotiating Appointment Setting InterfaceLayla El Asri, Rémi Lemonnier, Romain Laroche, Olivier Pietquin, Hatim Khouzaimi. 266-271 [doi]

DINASTI: Dialogues with a Negotiating Appointment Setting InterfaceLayla El Asri, Romain Laroche, Olivier Pietquin. 272-278 [doi]

El-WOZ: a client-server wizard-of-oz interfaceThomas Pellegrini, Vahid Hedayati, Ângela Costa. 279-282 [doi]

Tools for Arabic Natural Language Processing: a case study in qalqalah prosodyClaire Brierley, Majdi Sawalha, Eric Atwell. 283-287 [doi]

A Benchmark Database of Phonetic Alignments in Historical Linguistics and DialectologyJohann-Mattis List, Jelena Prokic. 288-294 [doi]

Rhapsodie: a Prosodic-Syntactic Treebank for Spoken FrenchAnne Lacheret, Sylvain Kahane, Julie Beliao, Anne Dister, Kim Gerdes, Jean Philippe Goldman, Nicolas Obin, Paola Pietrandrea, Atanas Tchobanov. 295-301 [doi]

C-PhonoGenre: a 7-hours corpus of 7 speaking styles in French: relations between situational features and prosodic propertiesJean Philippe Goldman, Tea Prsir, Antoine Auchlin. 302-305 [doi]

A Corpus and Phonetic Dictionary for Tunisian Arabic Speech RecognitionAbir Masmoudi, Mariem Ellouze Khmekhem, Yannick Estève, Lamia Hadrich Belguith, Nizar Habash. 306-310 [doi]

Towards Automatic Transformation between Different Transcription Conventions: Prediction of Intonation Markers from Linguistic and Acoustic FeaturesYuichi Ishimoto, Tomoyuki Tsuchiya, Hanae Koiso, Yasuharu Den. 311-315 [doi]

RSS-TOBI - A Prosodically Enhanced Romanian Speech CorpusTiberiu Boros, Adriana Stan, Oliver Watts, Stefan Daniel Dumitrescu. 316-320 [doi]

Segmentation evaluation metrics, a comparison grounded on prosodic and discourse unitsKlim Peshkov, Laurent Prévot. 321-325 [doi]

A Cross-language Corpus for Studying the Phonetics and Phonology of ProminenceBistra Andreeva, William J. Barry, Jacques C. Koreman. 326-330 [doi]

Using a machine learning model to assess the complexity of stress systemsLiviu P. Dinu, Alina Maria Ciobanu, Ioana Chitoran, Vlad Niculae. 331-336 [doi]

GlobalPhone: Pronunciation Dictionaries in 20 LanguagesTanja Schultz, Tim Schlippe. 337-341 [doi]

New Spanish speech corpus database for the analysis of people suffering from Parkinson's diseaseJuan Rafael Orozco-Arroyave, Julián David Arias-Londoño, Jesus Francisco Vargas Bonilla, María Claudia Gonzalez-Rátiva, Elmar Nöth. 342-347 [doi]

An Effortless Way To Create Large-Scale Datasets For Famous SpeakersFrançois Salmon, Félicien Vallet. 348-352 [doi]

German Alcohol Language Corpus - the Question of DialectFlorian Schiel, Thomas Kisler. 353-356 [doi]

Vulnerability in Acquisition, Language Impairments in Dutch: Creating a VALID Data ArchiveJetske Klatter, Roeland Van Hout, Henk van den Heuvel, Paula Fikkert, Anne Baker, Jan De Jong, Frank Wijnen, Eric Sanders, Paul Trilsbeek. 357-364 [doi]

The Nijmegen Corpus of Casual CzechMirjam Ernestus, Lucie Kocková-Amortová, Petr Pollák. 365-370 [doi]

CIEMPIESS: A New Open-Sourced Mexican Spanish Radio CorpusCarlos Daniel Hernandez Mena, Abel Herrera Camacho. 371-375 [doi]

MAPPING DIATOPIC AND DIACHRONIC VARIATION IN SPOKEN CZECH: THE ORTOFON AND DIALEKT CORPORAMarie Koprivová, Hana Golánová, Petra Klimesová, David Lukes. 376-382 [doi]

The Research and Teaching Corpus of Spoken German ― FOLKThomas Schmidt. 383-387 [doi]

Free Acoustic and Language Models for Large Vocabulary Continuous Speech Recognition in SwedishNiklas Vanhainen, Giampiero Salvi. 388-392 [doi]

Metadata as Linked Open Data: mapping disparate XML metadata registries into one RDF/OWL registryMarta Villegas, Maite Melero, Núria Bel. 393-400 [doi]

Representing Multilingual Data as Linked Data: the Case of BabelNet 2.0Maud Ehrmann, Francesco Cecconi, Daniele Vannella, John Philip McCrae, Philipp Cimiano, Roberto Navigli. 401-408 [doi]

Enabling Language Resources to Expose Translations as Linked Data on the WebJorge Gracia, Elena Montiel-Ponsoda, Daniel Vila-Suero, Guadalupe Aguado de Cea. 409-413 [doi]

A SKOS-based Schema for TEI encoded Dictionaries at ICLTTThierry Declerck, Karlheinz Mörth, Eveline Wandl-Vogt. 414-417 [doi]

TVD: A Reproducible and Multiply Aligned TV Series DatasetAnindya Roy, Camille Guinaudeau, Hervé Bredin, Claude Barras. 418-425 [doi]

Image Annotation with ISO-Space: Distinguishing Content from StructureJames Pustejovsky, Zachary Yocum. 426-431 [doi]

SAVAS: Collecting, Annotating and Sharing Audiovisual Language Resources for Automatic SubtitlingArantza del Pozo, Carlo Aliprandi, Aitor Álvarez, Carlos Mendes, Joao P. Neto, Sérgio Paulo, Nicola Piccinini, Matteo Raffaelli. 432-436 [doi]

Phoneme Similarity Matrices to Improve Long Audio Alignment for Automatic SubtitlingPablo Ruiz, Aitor Álvarez, Haritz Arzelus. 437-442 [doi]

KALAKA-3: a database for the recognition of spoken European languages on YouTube audiosLuis Javier Rodríguez-Fuentes, Mikel Peñagarikano, Amparo Varona, Mireia Díez, Germán Bordel. 443-449 [doi]

Named Entity Recognition on Turkish TweetsDilek Küçük, Guillaume Jacquet, Ralf Steinberger. 450-454 [doi]

Comprehensive Annotation of Multiword Expressions in a Social Web CorpusNathan Schneider, Spencer Onuffer, Nora Kazour, Emily Danchik, Michael T. Mordowanec, Henrietta Conrad, Noah A. Smith. 455-461 [doi]

Re-using an Argument Corpus to Aid in the Curation of Social Media CollectionsClare Llewellyn, Claire Grover, Jon Oberlander, Ewan Klein. 462-468 [doi]

#mygoal: Finding Motivations on TwitterMarc T. Tomlinson, David B. Bracewell, Wayne Krug, David Hinote. 469-474 [doi]

A Framework for Public Health SurveillanceAndrew Yates, Jon Parker, Nazli Goharian, Ophir Frieder. 475-482 [doi]

Bootstrapping Term Extractors for Multiple LanguagesAhmet Aker, Monica Lestari Paramita, Emma Barker, Robert J. Gaizauskas. 483-489 [doi]

Evaluation of Automatic Hypernym Extraction from Technical Corpora in English and DutchEls Lefever, Marjan Van de Kauter, Véronique Hoste. 490-497 [doi]

Resources for the Detection of Conventionalized Metaphors in Four LanguagesLori S. Levin, Teruko Mitamura, Brian MacWhinney, Davida Fromm, Jaime G. Carbonell, Weston Feely, Robert E. Frederking, Anatole Gershman, Carlos Ramirez. 498-501 [doi]

A language-independent and fully unsupervised approach to lexicon induction and part-of-speech tagging for closely related languagesYves Scherrer, Benoît Sagot. 502-508 [doi]

Optimizing a Distributional Semantic Model for the Prediction of German Particle Verb CompositionalityStefan Bott, Sabine Schulte im Walde. 509-516 [doi]

Open-domain Interaction and Online Content in the Sami LanguageKristiina Jokinen. 517-522 [doi]

The Gulf of Guinea Creole CorporaTjerk Hagemeijer, Michel Généreux, Iris Hendrickx, Amália Mendes, Abigail Tiny, Armando Zamora. 523-529 [doi]

Languagesindanger.eu - Including Multimedia Language Resources to disseminate Knowledge and Create Educational Material on less-Resourced LanguagesDagmar Jung, Katarzyna Klessa, Zsuzsa Duray, Beatrix Oszkó, Mária Sipos, Sándor Szeverényi, Zsuzsa Várnai, Trilsbeek Paul, Tamás Váradi. 530-535 [doi]

Casa de la Lhéngua: a set of language resources and natural language processing tools for MirandeseJosé Pedro Ferreira, Cristiano Chesi, Daan Baldewijns, Fernando Miguel Pinto, Margarita Correia, Daniela Braga, Hyongsil Cho, Amadeu Ferreira, Miguel Sales Dias. 536-540 [doi]

A finite-state morphological analyzer for a Lakota HPSG grammarChristian Curtis. 541-544 [doi]

Extrinsic Corpus Evaluation with a Collocation Dictionary TaskAdam Kilgarriff, Pavel Rychlý, Milos Jakubícek, Vojtech Kovár, Vít Baisa, Lucia Kocincová. 545-552 [doi]

Evaluating the effects of interactivity in a post-editing workbenchNancy L. Underwood, Bartolomé Mesa-Lao, Mercedes García-Martínez, Michael Carl, Vicent Alabau, Jesús González-Rubio, Luis A. Leiva, Germán Sanchis-Trilles, Daniel Ortiz-Martínez, Francisco Casacuberta. 553-559 [doi]

Bridging the gap between speech technology and natural language processing: an evaluation toolbox for term discovery systemsBogdan Ludusan, Maarten Versteegh, Aren Jansen, Guillaume Gravier, Xuan-Nga Cao, Mark Johnson, Emmanuel Dupoux. 560-567 [doi]

Introducing a Framework for the Evaluation of Music Detection ToolsPaula Lopez-Otero, Laura Docío Fernández, Carmen García-Mateo. 568-572 [doi]

Measuring Readability of Polish Texts: Baseline ExperimentsBartosz Broda, Bartlomiej Niton, Wlodzimierz Gruszczynski, Maciej Ogrodniczuk. 573-580 [doi]

Fuzzy V-Measure - An Evaluation Method for Cluster Analyses of Ambiguous DataJason Utt, Sylvia Springorum, Maximilian Köper, Sabine Schulte im Walde. 581-587 [doi]

Finding a Tradeoff between Accuracy and Rater's Workload in Grading Clustered Short AnswersAndrea Horbach, Alexis Palmer, Magdalena Wolska. 588-595 [doi]

Improving Evaluation of English-Czech MT through ParaphrasingPetra Barancikova, Rudolf Rosa, Ales Tamchyna. 596-601 [doi]

On the reliability and inter-annotator agreement of human semantic MT evaluation via HMEANTChi-kiu Lo, Dekai Wu. 602-607 [doi]

The evolving infrastructure for language resources and the role for data scientistsNelleke Oostdijk, Henk van den Heuvel. 608-612 [doi]

Using TEI, CMDI and ISOcat in CLARIN-DKDorte Haltrup Hansen, Lene Offersgaard, Sussi Olsen. 613-618 [doi]

ROOTS: a toolkit for easy, fast and consistent processing of large sequential annotated data collectionsJonathan Chevelu, Gwénolé Lecorvé, Damien Lolive. 619-626 [doi]

Sharing Cultural Heritage: the Clavius on the Web ProjectMatteo Abrate, Angelo Mario Del Grosso, Emiliano Giovannetti, Angelica Lo Duca, Damiana Luzzi, Lorenzo Mancini, Andrea Marchetti, Irene Pedretti, Silvia Piccini. 627-634 [doi]

'interHist' Ì¶ an interactive visual interface for corpus explorationVerena Lyding, Lionel Nicolas, Egon Stemle. 635-641 [doi]

Constructing a Chinese―Japanese Parallel Corpus from WikipediaChenhui Chu, Toshiaki Nakazawa, Sadao Kurohashi. 642-647 [doi]

An Iterative Approach for Mining Parallel Sentences in a Comparable CorpusLise Rebout, Philippe Langlais. 648-655 [doi]

Large SMT data-sets extracted from WikipediaDan Tufis. 656-663 [doi]

Production of Phrase Tables in 11 European Languages using an Improved Sub-sentential AlignerJuan Luo, Yves Lepage. 664-669 [doi]

Collection of a Simultaneous Translation Corpus for Comparative AnalysisHiroaki Shimizu, Graham Neubig, Sakriani Sakti, Tomoki Toda, Satoshi Nakamura. 670-673 [doi]

English-French Verb Phrase Alignment in Europarl for Tense Translation ModelingSharid Loáiciga, Thomas Meyer, Andrei Popescu-Belis. 674-681 [doi]

Two-Step Machine Translation with LatticesBushra Jawaid, Ondrej Bojar. 682-686 [doi]

The CMD CloudMatej Durco, Menzo Windhouwer. 687-690 [doi]

The eIdentity Text Exploration WorkbenchFritz Kliche, André Blessing, Ulrich Heid, Jonathan Sonntag. 691-697 [doi]

Visualization of Language Relations and Families: MultiTreeDamir Cavar, Malgorzata Cavar. 698-701 [doi]

Linked Open Data and Web Corpus Data for noun compound bracketingPierre André Ménard, Caroline Barrière. 702-709 [doi]

4FX: Light Verb Constructions in a Multilingual Parallel CorpusAnita Rácz, István Nagy T., Veronika Vincze. 710-715 [doi]

Identifying Idioms in Chinese TranslationsWan Yu Ho, Christine Kng, Shan Wang, Francis Bond. 716-721 [doi]

NARROWING THE GAP BETWEEN TERMBASES AND CORPORA IN COMMERCIAL ENVIRONMENTSKara Warburton. 722-727 [doi]

Identification of Multiword Expressions in the brWaCRodrigo Boos, Kassius Prestes, Aline Villavicencio. 728-735 [doi]

Collocation or Free Combination? ― Applying Machine Translation Techniques to identify collocations in JapaneseLis Pereira, Elga Strafella, Yuji Matsumoto. 736-739 [doi]

Building a Crisis Management Term Resource for Social Media: The Case of Floods and ProtestsIrina P. Temnikova, Andrea Varga, Dogan Biyikli. 740-747 [doi]

Towards building a Kashmiri Treebank: Setting up the Annotation PipelineRiyaz Ahmad Bhat, Shahid Musjtaq Bhat, Dipti Misra Sharma. 748-752 [doi]

A Japanese Word Dependency CorpusShinsuke Mori, Hideki Ogura, Tetsuro Sasada. 753-758 [doi]

A Compact Interactive Visualization of Dependency Treebank Query ResultsChris Culy, Marco Passarotti, Ulla König-Cardanobile. 759-766 [doi]

Thomas Aquinas in the TüNDRA: Integrating the Index Thomisticus Treebank into CLARIN-DScott Martens, Marco Passarotti. 767-774 [doi]

Boosting the creation of a treebankBlanca Arias, Núria Bel, Mercè Lorente, Montserrat Marimon, Alba Milà, Jorge Vivaldi, Muntsa Padró, Marina Fomicheva, Imanol Larrea. 775-781 [doi]

The IULA Spanish LSP TreebankMontserrat Marimon, Núria Bel, Beatríz Fisas, Blanca Arias, Silvia Vázquez, Jorge Vivaldi, Carlos Morell, Mercè Lorente. 782-788 [doi]

The Norwegian Dependency TreebankPer Erik Solberg, Arne Skjærholt, Lilja Øvrelid, Kristin Hagen, Janne Bondi Johannessen. 789-795 [doi]

A Persian Treebank with Stanford Typed DependenciesMojgan Seraji, Carina Jahani, Beáta Megyesi, Joakim Nivre. 796-801 [doi]

Converting an HPSG-based Treebank into its Parallel Dependency-based TreebankMasood Ghayoomi, Jonas Kuhn. 802-809 [doi]

On Stopwords, Filtering and Data Sparsity for Sentiment Analysis of TwitterHassan Saif, Miriam Fernández, Yulan He, Harith Alani. 810-817 [doi]

Investigating the Image of Entities in Social Media: Dataset Design and First ResultsJulien Velcin, Young-Min Kim, Caroline Brun, Jean-Yves Dormagen, Eric SanJuan, Leila Khouas, Anne Peradotto, Stéphane Bonnevay, Claude Roux, Julien Boyadjian, Alejandro Molina, Marie Neihouser. 818-822 [doi]

Benchmarking Twitter Sentiment Analysis ToolsAhmed Abbasi, Ammar Hassan, Milan Dhar. 823-829 [doi]

Recognising suicidal messages in Dutch social mediaBart Desmet, Véronique Hoste. 830-835 [doi]

Automatic detection of other-repetition occurrences: application to French conversational SpeechBrigitte Bigi, Roxane Bertrand, Mathilde Guardiola. 836-842 [doi]

ANCOR_Centre, a large free spoken French coreference corpus: description of the resource and reliability measuresJudith Muzerelle, Anaïs Lefeuvre, Emmanuel Schang, Jean-Yves Antoine, Aurore Pelletier, Denis Maurel, Iris Eshkol, Jeanne Villaneau. 843-847 [doi]

Phone Boundary Annotation in Conversational SpeechYi-Fen Liu, Shu-Chuan Tseng, Jyh-Shing Roger Jang. 848-853 [doi]

Automatically enriching spoken corpora with syntactic information for linguistic studiesAlexis Nasr, Frédéric Béchet, Benoît Favre, Thierry Bazillon, José Deulofeu, Andre Valli. 854-858 [doi]

Corpus Annotation through Crowdsourcing: Towards Best Practice GuidelinesMarta Sabou, Kalina Bontcheva, Leon Derczynski, Arno Scharl. 859-866 [doi]

Towards an environment for the production and the validation of lexical semantic resourcesMikaël Morardo, Éric Villemonte de la Clergerie. 867-874 [doi]

Towards an Encyclopedia of Compositional Semantics: Documenting the Interface of the English Resource GrammarDan Flickinger, Emily M. Bender, Stephan Oepen. 875-881 [doi]

Mapping CPA Patterns onto OntoNotes SensesOctavian Popescu, Martha Palmer, Patrick Hanks. 882-889 [doi]

T-PAS; A resource of Typed Predicate Argument Structures for linguistic analysis and semantic processingElisabetta Jezek, Bernardo Magnini, Anna Feltracco, Alessia Bianchini, Octavian Popescu. 890-895 [doi]

The N2 corpus: A semantically annotated collection of Islamist extremist storiesMark A. Finlayson, Jeffry R. Halverson, Steven R. Corman. 896-902 [doi]

Predicate Matrix: extending SemLink through WordNet mappingsMaddalen Lopez de Lacalle, Egoitz Laparra, German Rigau. 903-909 [doi]

A Unified Annotation Scheme for the Semantic/Pragmatic Components of DefinitenessArchna Bhatia, Mandy Simons, Lori S. Levin, Yulia Tsvetkov, Chris Dyer, Jordan Bender. 910-916 [doi]

A Model for Processing Illocutionary Structures and Argumentation in DebatesKatarzyna Budzynska, Mathilde Janier, Chris Reed, Patrick Saint-Dizier, Manfred Stede, Olena Yakorska. 917-924 [doi]

Potsdam Commentary Corpus 2.0: Annotation for Discourse ResearchManfred Stede, Arne Neumann. 925-929 [doi]

Verbs of Saying with a Textual Connecting Function in the Prague Discourse TreebankMagdalena Rysova. 930-935 [doi]

Building a Corpus of Manually Revised Texts from Discourse PerspectiveRyu Iida, Takenobu Tokunaga. 936-941 [doi]

The CUHK Discourse TreeBank for Chinese: Annotating Explicit Discourse Connectives for the Chinese TreeBankLanjun Zhou, Binyang Li, Zhongyu Wei, Kam-Fai Wong. 942-949 [doi]

Computational Narratology: Extracting Tense Clusters from Narrative TextsThomas Bögel, Jannik Strötgen, Michael Gertz. 950-955 [doi]

Can Numerical Expressions Be Simpler? Implementation and Demostration of a Numerical Simplification System for SpanishSusana Bautista, Horacio Saggion. 956-962 [doi]

Cross-linguistic annotation of narrativity for English/French verb tense disambiguationCristina Grisot, Thomas Meyer. 963-966 [doi]

A Database for Measuring Linguistic Information ContentRichard Sproat, Bruno Cartoni, HyunJeong Choe, David Huynh, Linne Ha, Ravindran Rajakumar, Evelyn Wenzel-Grondie. 967-974 [doi]

Valency and Word Order in Czech ― A Corpus ProbeKaterina Rysova, Jirí Mírovský. 975-980 [doi]

Mörkum Njálu. An annotated corpus to analyse and explain grammatical divergences between 14th-century manuscripts of Njál's sagaLudger Zeevaert. 981-987 [doi]

GenitivDB ― a Corpus-Generated Database for German Genitive ClassificationRoman Schneider. 988-994 [doi]

Building a reference lexicon for countability in EnglishTibor Kiss, Francis Jeffry Pelletier, Tobias Stadtfeld. 995-1000 [doi]

Disambiguating Verbs by Collocation: Corpus Lexicography meets Natural Language ProcessingIsmaïl El Maarouf, Jane Bradbury, Vít Baisa, Patrick Hanks. 1001-1006 [doi]

GLÀFF, a Large Versatile French LexiconNabil Hathout, Franck Sajous, Basilio Calderone. 1007-1012 [doi]

Bilingual Dictionary Construction with Transliteration FilteringJohn Richardson, Toshiaki Nakazawa, Sadao Kurohashi. 1013-1017 [doi]

Bootstrapping Open-Source English-Bulgarian Computational DictionaryKrasimir Angelov. 1018-1023 [doi]

MotàMot project: conversion of a French-Khmer published dictionary for building a multilingual lexical systemMathieu Mangeot. 1024-1031 [doi]

RELISH LMF: Unlocking the Full Power of the Lexical Markup FrameworkMenzo Windhouwer, Justin Petro, Shakila Shayan. 1032-1037 [doi]

Building a Dataset of Multilingual Cognates for the Romanian LexiconLiviu P. Dinu, Alina Maria Ciobanu. 1038-1043 [doi]

LexTec ― a rich language resource for technical domains in PortuguesePalmira Marrafa, Raquel Amaro, Sara Mendes. 1044-1050 [doi]

Amazigh Verb ConjugatorFadoua Ataa-Allah, Siham Boulaknadel. 1051-1055 [doi]

The Development of Dutch and Afrikaans Language Resources for Compound Boundary AnalysisMenno van Zaanen, Gerhard B. Van Huyssteen, Suzanne Aussems, Chris Emmery, Roald Eiselen. 1056-1062 [doi]

Zmorge: A German Morphological Lexicon Extracted from WiktionaryRico Sennrich, Beat Kunz. 1063-1067 [doi]

A New Form of Humor ― Mapping Constraint-Based Computational Morphologies to a Finite-State RepresentationAttila Novák. 1068-1073 [doi]

Szeged Corpus 2.5: Morphological Modifications in a Manually POS-tagged Hungarian CorpusVeronika Vincze, Viktor Varga, Katalin Ilona Simkó, János Zsibrita, Ágoston Nagy, Richárd Farkas, János Csirik. 1074-1078 [doi]

A set of open source tools for Turkish natural language processingÇagri Çöltekin. 1079-1086 [doi]

Word-Formation Network for CzechMagda Sevcíková, Zdenek Zabokrtský. 1087-1093 [doi]

MADAMIRA: A Fast, Comprehensive Tool for Morphological Analysis and Disambiguation of ArabicArfath Pasha, Mohamed Al-Badrashiny, Mona T. Diab, Ahmed El Kholy, Ramy Eskander, Nizar Habash, Manoj Pooleery, Owen Rambow, Ryan Roth. 1094-1101 [doi]

Computer-aided morphology expansion for Old SwedishYvonne Adesam, Malin Ahlberg, Peter Andersson, Gerlof Bouma, Markus Forsberg, Mans Hulden. 1102-1105 [doi]

Morfeusz ReloadedMarcin Wolinski. 1106-1111 [doi]

Automatic creation of WordNets from parallel corporaAntoni Oliver, Salvador Climent. 1112-1116 [doi]

Mapping WordNet Domains, WordNet Topics and Wikipedia Categories to Generate Multilingual Domain Specific ResourcesSpandana Gella, Carlo Strapparava, Vivi Nastase. 1117-1121 [doi]

Adapting VerbNet to French using existing resourcesQuentin Pradet, Laurence Danlos, Gaël de Chalendar. 1122-1126 [doi]

Bootstrapping an Italian VerbNet: data-driven analysis of verb alternationsGianluca Lebani, Veronica Viola, Alessandro Lenci. 1127-1134 [doi]

DENSE COMPONENTS IN THE STRUCTURE OF WORDNETAhti Lohk, Kaarel Allik, Heili Orav, Leo Võhandu. 1135-1139 [doi]

The Making of Ancient Greek WordNetYuri Bizzoni, Federico Boschetti, Harry Diakoff, Riccardo Del Gratta, Monica Monachini, Gregory Crane. 1140-1147 [doi]

Etymological Wordnet: Tracing The History of WordsGerard de Melo. 1148-1154 [doi]

Generating Polarity Lexicons with WordNet propagation in 5 languagesIsa Maks, Rubén Izquierdo, Francesca Frontini, Rodrigo Agerri, Piek Vossen, Andoni Azpeitia. 1155-1161 [doi]

SANA: A Large Scale Multi-Genre, Multi-Dialect Lexicon for Arabic Subjectivity and Sentiment AnalysisMuhammad Abdul-Mageed, Mona T. Diab. 1162-1169 [doi]

On the Importance of Text Analysis for Stock Price PredictionHeeyoung Lee, Mihai Surdeanu, Bill MacCartney, Dan Jurafsky. 1170-1175 [doi]

An Analysis of Older Users' Interactions with Spoken Dialogue SystemsJamie Bost, Johanna D. Moore. 1176-1181 [doi]

Alert!... Calm Down, There is Nothing to Worry About. Warning and Soothing Speech SynthesisMilan Rusko, Sakhia Darjaa, Marián Trnka, Marian Ritomský, Róbert Sabo. 1182-1187 [doi]

Prosodic, syntactic, semantic guidelines for topic structures across domains and corporaAna Isabel Mata, Helena Moniz, Telmo Móia, Anabela Gonçalves, Fátima Silva, Fernando Batista, Inês Duarte, Fátima C. E. Oliveira, Isabel Falé. 1188-1193 [doi]

How to Tell a Schneemann from a Milchmann: An Annotation Scheme for Compound-Internal RelationsCorina Dima, Verena Henrich, Erhard W. Hinrichs, Christina Hoppermann. 1194-1201 [doi]

Semi-compositional Method for Synonym Extraction of Multi-Word TermsBéatrice Daille, Amir Hazem. 1202-1207 [doi]

Multiword Expressions in Machine TranslationValia Kordoni, Iliana Simova. 1208-1211 [doi]

A Database of Freely Written Texts of German School Students for the Purpose of Automatic Spelling Error ClassificationKay Berkling, Johanna Fay, Masood Ghayoomi, Katrin Hein, Rémi Lavalley, Ludwig Linhuber, Sebastian Stüker. 1212-1217 [doi]

Towards Shared Datasets for Normalization ResearchOrphée De Clercq, Sarah Schulz, Bart Desmet, Véronique Hoste. 1218-1223 [doi]

Synergy of Nederlab andMartin Reynaert. 1224-1230 [doi]

Translation errors from English to Portuguese: an annotated corpusÂngela Costa, Tiago Luís, Luísa Coheur. 1231-1234 [doi]

CoRoLa ― The Reference Corpus of Contemporary Romanian LanguageVerginica Barbu Mititelu, Elena Irimia, Dan Tufis. 1235-1239 [doi]

A Multidialectal Parallel Corpus of ArabicHouda Bouamor, Nizar Habash, Kemal Oflazer. 1240-1245 [doi]

YouDACC: the Youtube Dialectal Arabic Comment CorpusAhmed Salama, Houda Bouamor, Behrang Mohit, Kemal Oflazer. 1246-1251 [doi]

Comparing two acquisition systems for automatically building an English-Croatian parallel corpus from multilingual websitesMiquel Esplà-Gomis, Filip Klubicka, Nikola Ljubesic, Sergio Ortiz-Rojas, Vassilis Papavassiliou, Prokopis Prokopidis. 1252-1258 [doi]

Towards an Integration of Syntactic and Temporal Annotations in EstonianSiim Orasmaa. 1259-1266 [doi]

Annotation of specialized corpora using a comprehensive entity and relation schemeLouise Deléger, Anne-Laure Ligozat, Cyril Grouin, Pierre Zweigenbaum, Aurélie Névéol. 1267-1274 [doi]

Developing Politeness Annotated Corpus of Hindi BlogsRitesh Kumar. 1275-1280 [doi]

The MERLIN corpus: Learner language and the CEFRAdriane Boyd, Jirka Hana, Lionel Nicolas, Detmar Meurers, Katrin Wisniewski, Andrea Abel, Karin Schöne, Barbora Stindlová, Chiara Vettori. 1281-1288 [doi]

DysList: An Annotated Resource of Dyslexic ErrorsLuz Rello, Ricardo A. Baeza-Yates, Joaquim Llisterri. 1289-1296 [doi]

Criteria for Identifying and Annotating Caused Motion Constructions in Corpus DataJena D. Hwang, Annie Zaenen, Martha Palmer. 1297-1304 [doi]

The American Local News CorpusAnn Irvine, Joshua Langfus, Chris Callison-Burch. 1305-1308 [doi]

A LDA-BASED TOPIC CLASSIFICATION APPROACH FROM HIGHLY IMPERFECT AUTOMATIC TRANSCRIPTIONSMohamed Morchid, Richard Dufour, Georges Linares. 1309-1314 [doi]

How to Use less Features and Reach Better Performance in Author Gender IdentificationJuan Soler, Leo Wanner. 1315-1319 [doi]

Genres in the Prague Discourse TreebankLucie Poláková, Pavlína Jínová, Jirí Mírovský. 1320-1326 [doi]

Data Mining with Shallow vs. Linguistic Features to Study Diversification of Scientific RegistersStefania Degaetano-Ortlieb, Peter Fankhauser, Hannah Kermes, Ekaterina Lapshinova-Koltunski, Noam Ordan, Elke Teich. 1327-1334 [doi]

Detecting Document Structure in a Very Large Corpus of UK Financial ReportsMahmoud El-Haj, Paul Rayson, Steve Young, Martin Walker. 1335-1338 [doi]

Designing and Evaluating a Reliable Corpus of Web Genres via Crowd-SourcingNoushin Rezapour Asheghi, Serge Sharoff, Katja Markert. 1339-1346 [doi]

Locating Requests among Open Source Software Communication MessagesIoannis Korkontzelos, Sophia Ananiadou. 1347-1354 [doi]

Sockpuppet Detection in Wikipedia: A Corpus of Real-World Deceptive Writing for Linking IdentitiesThamar Solorio, Ragib Hasan, Mainul Mizan. 1355-1358 [doi]

Reusing Swedish FrameNet for training semantic rolesIldikó Pilán, Elena Volodina. 1359-1363 [doi]

Discovering frames in specialized domainsMarie-Claude L'Homme, Benoît Robichaud, Carlos Subirats Rüggeberg. 1364-1371 [doi]

Developing a French FrameNet: Methodology and First resultsMarie Candito, Pascal Amsili, Lucie Barque, Farah Benamara, Gaël de Chalendar, Marianne Djemaa, Pauline Haas, Richard Huyghe, Yvette Yannick Mathieu, Philippe Muller, Benoît Sagot, Laure Vieu. 1372-1379 [doi]

Corpus-Based Computation of Reverse AssociationsReinhard Rapp. 1380-1386 [doi]

First approach toward Semantic Role Labeling for BasqueHaritz Salaberri, Olatz Arregi, Beñat Zapirain. 1387-1393 [doi]

Constructing a Corpus of Japanese Predicate Phrases for Synonym/Antonym RelationsTomoko Izumi, Tomohide Shibata, Hisako Asano, Yoshihiro Matsuo, Sadao Kurohashi. 1394-1400 [doi]

Distributed Distributional Similarities of Google Books over the CenturiesMartin Riedl, Richard Steuer, Chris Biemann. 1401-1405 [doi]

Lexical Substitution Dataset for GermanKostadin Cholakov, Chris Biemann, Judith Eckle-Kohler, Iryna Gurevych. 1406-1411 [doi]

Buy one get one free: Distant annotation of Chinese tense, event type and modalityNianwen Xue, Yuchen Zhang. 1412-1416 [doi]

Latent Semantic Analysis Models on Wikipedia and TASADan Stefanescu, Rajendra Banjade, Vasile Rus. 1417-1422 [doi]

Annotation of Computer Science Papers for Semantic Relation Extrac-tionYuka Tateisi, Yo Shidahara, Yusuke Miyao, Akiko Aizawa. 1423-1429 [doi]

Automatic Extraction of Synonyms for German Particle Verbs from Parallel Data with Distributional Similarity as a Re-Ranking FeatureMoritz Wittmann, Marion Weller, Sabine Schulte im Walde. 1430-1437 [doi]

DBpedia Domains: augmenting DBpedia with domain informationGregor Titze, Volha Bryl, Cäcilia Zirn, Simone Paolo Ponzetto. 1438-1442 [doi]

Classifying Inconsistencies in DBpedia Language Specific ChaptersElena Cabrio, Serena Villata, Fabien Gandon. 1443-1450 [doi]

The Database for Spoken German ― DGD2Thomas Schmidt. 1451-1457 [doi]

The EASR Corpora of European Portuguese, French, Hungarian and Polish Elderly SpeechAnnika Hämäläinen, Jairo Avelar, Silvia Rodrigues, Miguel Sales Dias, Artur Kolesinski, Tibor Fegyó, Géza Németh, Petra Csobánka, Karine Lan, David Hewson. 1458-1464 [doi]

GRASS: the Graz corpus of Read And Spontaneous SpeechBarbara Schuppler, Martin Hagmueller, Juan Andres Morales-Cordovilla, Hannes Pessentheiner. 1465-1470 [doi]

Design and development of an RDB version of the Corpus of Spontaneous JapaneseHanae Koiso, Yasuharu Den, Ken'ya Nishikawa, Kikuo Maekawa. 1471-1476 [doi]

Designing a Bilingual Speech Corpus for French and German Language Learners: a Two-Step ProcessCamille Fauth, Anne Bonneau, Frank Zimmerer, Jürgen Trouvain, Bistra Andreeva, Vincent Colotte, Dominique Fohr, Denis Jouvet, Jeanin Jügler, Yves Laprie, Odile Mella, Bernd Möbius. 1477-1482 [doi]

Semi-automatic annotation of the UCU accents speech corpusRosemary Orr, Marijn Huijbregts, Roeland van Beek, Lisa Teunissen, Kate Backhouse, David A. van Leeuwen. 1483-1487 [doi]

A corpus of European Portuguese child and child-directed speechAna Lúcia Santos, Michel Généreux, Aida Cardoso, Celina Agostinho, Silvana Abalada. 1488-1491 [doi]

The SSPNet-Mobile Corpus: Social Signal Processing Over Mobile PhonesAnna Polychroniou, Hugues Salamin, Alessandro Vinciarelli. 1492-1498 [doi]

Annotation Pro + TGA: automation of speech timing analysisKatarzyna Klessa, Dafydd Gibbon. 1499-1505 [doi]

The Munich Biovoice Corpus: Effects of Physical Exercising, Heart Rate, and Skin Conductance on Human Speech ProductionBjörn Schuller, Felix Friedmann, Florian Eyben. 1506-1510 [doi]

ELRA's Consolidated Services for the HLT CommunityVictoria Arranz, Khalid Choukri, Valérie Mapelli, Hélène Mazo. 1511-1516 [doi]

The Strategic Impact of META-NET on the Regional, National and International LevelGeorg Rehm, Hans Uszkoreit, Sophia Ananiadou, Núria Bel, Audroné Bieleviciené, Lars Borin, António Branco, Gerhard Budin, Nicoletta Calzolari, Walter Daelemans, Radovan Garabík, Marko Grobelnik, Carmen García-Mateo, Josef van Genabith, Jan Hajic, Inma Hernáez, John Judge, Svetla Koeva, Simon Krek, Cvetana Krstev, Krister Lindén, Bernardo Magnini, Joseph Mariani, John McNaught, Maite Melero, Monica Monachini, Asunción Moreno, Jan Odijk, Maciej Ogrodniczuk, Piotr Pezik, Stelios Piperidis, Adam Przepiórkowski, Eiríkur Rögnvaldsson, Michael Rosner, Bolette S. Pedersen, Inguna Skadina, Koenraad De Smedt, Marko Tadic, Paul Thompson, Dan Tufis, Tamás Váradi, Andrejs Vasiljevs, Kadri Vider, Jolanta Zabarskaite. 1517-1524 [doi]

The CLARIN Research Infrastructure: Resources and Tools for eHumanities ScholarsErhard W. Hinrichs, Steven Krauwer. 1525-1531 [doi]

META-SHARE: One year afterStelios Piperidis, Harris Papageorgiou, Christian Spurk, Georg Rehm, Khalid Choukri, Olivier Hamon, Nicoletta Calzolari, Riccardo Del Gratta, Bernardo Magnini, Christian Girardi. 1532-1538 [doi]

New Directions for Language Resource Development and DistributionChristopher Cieri, Denise DiPersio, Mark Liberman, Andrea Mazzucchi, Stephanie Strassel, Jonathan Wright. 1539-1546 [doi]

Designing the Latvian Speech Recognition CorpusMarcis Pinnis, Ilze Auzina, Karlis Goba. 1547-1553 [doi]

A Corpus of Spontaneous Speech in Lectures: The KIT Lecture Corpus for Spoken Language Processing and TranslationEunah Cho, Sarah Fünfer, Sebastian Stüker, Alex Waibel. 1554-1559 [doi]

The pragmatic annotation of a corpus of academic lecturesSian Alsop, Hilary Nesi. 1560-1563 [doi]

HESITA(te) in PortugueseSara Candeias, Dirce Celorico, Jorge Proença, Arlindo Veiga, Carla Lopes, Fernando Perdigão. 1564-1567 [doi]

VOCE Corpus: Ecologically Collected Speech Annotated with Physiological and Psychological Stress AssessmentsAna Aguiar, Mariana Kaiseler, Hugo Meinedo, Pedro R. Almeida, Mariana Cunha, Jorge Silva. 1568-1574 [doi]

The Impact of Cohesion Errors in Extraction Based SummariesEvelina Rennes, Arne Jönsson. 1575-1582 [doi]

Out in the Open: Finding and Categorising Errors in the Lexical Simplification PipelineMatthew Shardlow. 1583-1590 [doi]

LQVSumm: A Corpus of Linguistic Quality Violations in Multi-Document SummarizationAnnemarie Friedrich, Marina Valeeva, Alexis Palmer. 1591-1599 [doi]

Summarizing News Clusters on the Basis of Thematic ChainsNatalia V. Loukachevitch, Aleksey Alekseev. 1600-1607 [doi]

A Repository of State of the Art and Competitive Baseline Summaries for Generic News SummarizationKai Hong, John M. Conroy, Benoît Favre, Alex Kulesza, Hui Lin, Ani Nenkova. 1608-1616 [doi]

The Interplay Between Lexical and Syntactic Resources in Incremental ParsebankingVictoria Rosén, Petter Haugereid, Martha Thunes, Gyri S. Losnegaard, Helge Dyvik. 1617-1624 [doi]

An efficient language independent toolkit for complete morphological disambiguationLászló János Laki, György Orosz. 1625-1630 [doi]

Language Resource Addition: Dictionary or Corpus?Shinsuke Mori, Graham Neubig. 1631-1636 [doi]

Utilizing constituent structure for compound analysisKristín Bjarnadóttir, Jón Daðason. 1637-1641 [doi]

Word Semantic Similarity for Morphologically Rich LanguagesKalliopi Zervanou, Elias Iosif, Alexandros Potamianos. 1642-1648 [doi]

Digital Library 2.0: Source of Knowledge and Research Collaboration PlatformWlodzimierz Gruszczynski, Maciej Ogrodniczuk. 1649-1653 [doi]

Exploiting networks in LawLivio Robaldo, Guido Boella, Luigi Di Caro, Andrea Violato. 1654-1658 [doi]

Guampa: a Toolkit for Collaborative TranslationAlex Rudnick, Taylor Skidmore, Alberto Samaniego, Michael Gasser. 1659-1663 [doi]

The Halliday Centre Tagger: An Online Platform for Semi-automatic Text Annotation and AnalysisBilly Tak-Ming Wong, Ian C. Chow, Jonathan J. Webster, Hengbin Yan. 1664-1667 [doi]

Modeling, Managing, Exposing, and Linking Ontologies with a Wiki-based ToolMauro Dragoni, Alessio Bosca, Matteo Casu, Andi Rexha. 1668-1675 [doi]

Propa-L: a semantic filtering service from a lexical network created using Games With A PurposeMathieu Lafourcade, Karën Fort. 1676-1681 [doi]

Open Philology at the University of LeipzigFrederik Baumgardt, Giuseppe Celano, Gregory R. Crane, Stella Dee, Maryam Foradi, Emily Franzini, Greta Franzini, Monica Lent, Maria Moritz, Simona Stoyanova. 1682-1685 [doi]

LexTerm Manager: Design for an Integrated Lexicography and Terminology SystemJoshua Elliot, Logan Kearsley, Jason Housley, Alan K. Melby. 1686-1691 [doi]

RESTful Annotation and Efficient CollaborationJonathan Wright. 1692-1698 [doi]

Collecting Natural SMS and Chat Conversations in Multiple Languages: The BOLT Phase 2 CorpusZhiyi Song, Stephanie Strassel, Haejoong Lee, Kevin Walker, Jonathan Wright, Jennifer Garland, Dana Fore, Brian Gainor, Preston Cabe, Thomas Thomas, Brendan Callahan, Ann Sawyer. 1699-1704 [doi]

The Slovak Categorized News CorpusDaniel Hládek, Ján Stas, Jozef Juhar. 1705-1708 [doi]

TUKE-BNews-SK: Slovak Broadcast News Corpus Construction and EvaluationMatús Pleva, Jozef Juhar. 1709-1713 [doi]

Sublanguage Corpus Analysis Toolkit: A tool for assessing the representativeness and sublanguage characteristics of corporaIrina P. Temnikova, William A. Baumgartner Jr., Negacy D. Hailu, Ivelina Nikolova, Tony McEnery, Adam Kilgarriff, Galia Angelova, K. Bretonnel Cohen. 1714-1718 [doi]

The Hungarian Gigaword CorpusCsaba Oravecz, Tamás Váradi, Bálint Sass. 1719-1723 [doi]

The SETimes.HR Linguistically Annotated Corpus of CroatianZeljko Agic, Nikola Ljubesic. 1724-1727 [doi]

caWaC - A web corpus of Catalan and its application to language modeling and machine translationNikola Ljubesic, Antonio Toral. 1728-1732 [doi]

ACTIV-ES: a comparable, cross-dialect corpus of 'everyday' Spanish from Argentina, Mexico, and SpainJerid Francom, Mans Hulden, Adam Ussishkin. 1733-1737 [doi]

Language Editing Dataset of Academic TextsVidas Daudaravicius. 1738-1742 [doi]

Annotating the Focus of Negation in Japanese TextSuguru Matsuyoshi, Ryo Otsuki, Fumiyo Fukumoto. 1743-1750 [doi]

A Corpus of Participant Roles in Contentious DiscussionsSiddharth Jain, Archna Bhatia, Angelique Rein, Eduard H. Hovy. 1751-1756 [doi]

CFT13: A resource for research into the post-editing processMichael Carl, Mercedes García-Martínez, Bartolomé Mesa-Lao. 1757-1764 [doi]

Not an Interlingua, But Close: Comparison of English AMRs to Chinese and CzechNianwen Xue, Ondrej Bojar, Jan Hajic, Martha Palmer, Zdenka Uresová, Xiuhong Zhang. 1765-1772 [doi]

On Complex Word Alignment ConfigurationsMiriam Kaeshammer, Anika Westburg. 1773-1780 [doi]

Shata-Anuvadak: Tackling Multiway Translation of Indian LanguagesAnoop Kunchukuttan, Abhijit Mishra, Rajen Chatterjee, Ritesh M. Shah, Pushpak Bhattacharyya. 1781-1787 [doi]

Automatic Annotation of Machine Translation Datasets with Binary Quality JudgementsMarco Turchi, Matteo Negri. 1788-1792 [doi]

A Large-Scale Evaluation of Pre-editing Strategies for Improving User-Generated Content TranslationVioleta Seretan, Pierrette Bouillon, Johanna Gerlach. 1793-1799 [doi]

Rule-based Reordering Space in Statistical Machine TranslationNicolas Pécheux, Alexandre Allauzen, François Yvon. 1800-1806 [doi]

Hindi to English Machine Translation: Using Effective Selection in Multi-Model SMTKunal Sachdeva, Rishabh Srivastava, Sambhav Jain, Dipti Misra Sharma. 1807-1811 [doi]

Benchmarking of English-Hindi parallel corporaJayendra Rakesh Yeka, Prasanth Kolachina, Dipti Misra Sharma. 1812-1818 [doi]

Transliteration and alignment of parallel texts from Cyrillic to LatinPetic Mircea, Daniela Gîfu. 1819-1823 [doi]

Exploiting catenae in a parallel treebank alignmentManuela Sanguinetti, Cristina Bosco, Loredana Cupi. 1824-1831 [doi]

SwissAdmin: A multilingual tagged parallel corpus of press releasesYves Scherrer, Luka Nerima, Lorenza Russo, Maria Ivanova, Eric Wehrli. 1832-1836 [doi]

UM-Corpus: A Large English-Chinese Parallel Corpus for Statistical Machine TranslationLiang Tian, Derek F. Wong, Lidia S. Chao, Paulo Quaresma, Francisco Oliveira, Lu Yi. 1837-1842 [doi]

Quality Estimation for Synthetic Parallel Data GenerationRaphaël Rubino, Antonio Toral, Nikola Ljubesic, Gema Ramírez-Sánchez. 1843-1849 [doi]

Billions of Parallel Words for Free: Building and Using the EU Bookshop CorpusRaivis Skadins, Jörg Tiedemann, Roberts Rozis, Daiga Deksne. 1850-1855 [doi]

The AMARA Corpus: Building Parallel Language Resources for the Educational DomainAhmed Abdelali, Francisco Guzmán, Hassan Sajjad, Stephan Vogel. 1856-1862 [doi]

Incorporating Alternate Translations into English Translation TreebankAnn Bies, Justin Mott, Seth Kulick, Jennifer Garland, Colin Warner. 1863-1868 [doi]

Dual Subtitles as Parallel CorporaShikun Zhang, Wang Ling, Chris Dyer. 1869-1874 [doi]

Aligning parallel texts with InterTextPavel Vondricka. 1875-1879 [doi]

Expanding n-gram analytics in ELAN and a case study for sign synthesisRosalee Wolfe, John C. McDonald, Larwan Berke, Marie Stumbo. 1880-1885 [doi]

SLMotion - An extensible sign language oriented video analysis toolMatti Karppa, Ville Viitaniemi, Marcos Luzardo, Jorma Laaksonen, Tommi Jantunen. 1886-1891 [doi]

S-pot - a benchmark in spotting signs within continuous signingVille Viitaniemi, Tommi Jantunen, Leena Savolainen, Matti Karppa, Jorma Laaksonen. 1892-1897 [doi]

A Colloquial Corpus of Japanese Sign Language: Linguistic Resources for Observing Sign Language ConversationsMayumi Bono, Kouhei Kikuchi, Paul Cibulka, Yutaka Osugi. 1898-1904 [doi]

Exploring factors that contribute to successful fingerspelling comprehensionLeah Geer, Jonathan Keane. 1905-1910 [doi]

Extensions of the Sign Language Recognition and Translation Corpus RWTH-PHOENIX-WeatherJens Forster, Christoph Schmidt, Oscar Koller, Martin Bellgardt, Hermann Ney. 1911-1916 [doi]

The Use of a FileMaker Pro Database in Evaluating Sign Language Notation SystemsJulie Hochgesang. 1917-1923 [doi]

A New Framework for Sign Language Recognition based on 3D Handshape Identification and Linguistic ModelingMark Dilsizian, Polina Yanovich, Shu Wang, Carol Neidle, Dimitris N. Metaxas. 1924-1929 [doi]

Annotating Arguments: The NOMAD Collaborative Annotation ToolGeorgios Petasis. 1930-1937 [doi]

Pivot-based multilingual dictionary building using WiktionaryJudit Ács. 1938-1942 [doi]

Terminology Resources and Terminology Work Benefit from Cloud ServicesTatiana Gornostay, Andrejs Vasiljevs. 1943-1948 [doi]

Crowdsourcing for the identification of event nominals: an experimentRachele Sprugnoli, Alessandro Lenci. 1949-1955 [doi]

Combining elicited imitation and fluency features for oral proficiency measurementDeryle Lonsdale, Carl Christensen. 1956-1961 [doi]

On the use of a fuzzy classifier to speed up the Sp_ToBI labeling of the Glissando Spanish corpusDavid Escudero Mancebo, Lourdes Aguilar-Cuevas, César González Ferreras, Yurena Gutiérrez-González, Valentín Cardeñoso-Payo. 1962-1969 [doi]

The RATS Collection: Supporting HLT Research with Degraded Audio DataDavid Graff, Kevin Walker, Stephanie Strassel, Xiaoyi Ma, Karen Jones, Ann Sawyer. 1970-1977 [doi]

Eliciting and Annotating Uncertainty in Spoken LanguageHeather Pon-Barry, Stuart M. Shieber, Nicholas Longenbaugh. 1978-1983 [doi]

The Meta-knowledge of Causality in Biomedical Scientific DiscourseClaudiu Mihaila, Sophia Ananiadou. 1984-1991 [doi]

Co-clustering of bilingual datasets as a mean for assisting the construction of thematic bilingual comparable corporaGuiyao Ke, Pierre-François Marteau. 1992-1999 [doi]

NewsReader: recording history from daily news streamsPiek Vossen, German Rigau, Luciano Serafini, Pim Stouten, Francis Irving, Willem Robert van Hage. 2000-2007 [doi]

Identification of Technology Terms in PatentsPeter G. Anick, Marc Verhagen, James Pustejovsky. 2008-2014 [doi]

Cross-Language Authorship AttributionDasha Bogdanova, Angeliki Lazaridou. 2015-2020 [doi]

Learning from Domain ComplexityRobert Remus, Dominique Ziegelmayer. 2021-2028 [doi]

Using Word Familiarities and Word Associations to Measure Corpus RepresentativenessReinhard Rapp. 2029-2036 [doi]

Extracting News Web Page Creation Time with DCTFinderXavier Tannier. 2037-2042 [doi]

Information Extraction from German Patient Records via Hybrid Parsing and Relation Extraction StrategiesHans-Ulrich Krieger, Christian Spurk, Hans Uszkoreit, Feiyu Xu, Yi Zhang, Frank Müller, Thomas Tolxdorff. 2043-2048 [doi]

Media monitoring and information extraction for the highly inflected agglutinative language HungarianJúlia Pajzs, Ralf Steinberger, Maud Ehrmann, Mohamed Ebrahim, Leonida Della-Rocca, Stefano Bucci, Eszter Simon, Tamás Váradi. 2049-2056 [doi]

Creating a Gold Standard Corpus for the Extraction of Chemistry-Disease Relations from Patent TextsAntje Schlaf, Claudia Bobach, Matthias Irmer. 2057-2061 [doi]

T2K^2: a System for Automatically Extracting and Organizing Knowledge from TextsFelice dell'Orletta, Giulia Venturi, Andrea Cimino, Simonetta Montemagni. 2062-2070 [doi]

Freepal: A Large Collection of Deep Lexico-Syntactic Patterns for Relation ExtractionJohannes Kirschnick, Alan Akbik, Holmer Hemsen. 2071-2075 [doi]

Ranking Job Offers for Candidates: learning hidden knowledge from Big DataMarc Poch, Núria Bel, Sergio Espeja, Felipe Navio. 2076-2082 [doi]

Hot Topics and Schisms in NLP: Community and Trend Analysis with Saffron on ACL and LREC ProceedingsPaul Buitelaar, Georgeta Bordea, Barry Coughlan. 2083-2088 [doi]

Textual Emigration Analysis (TEA)André Blessing, Jonas Kuhn. 2089-2093 [doi]

WordNet―Wikipedia―Wiktionary: Construction of a Three-way AlignmentTristan Miller, Iryna Gurevych. 2094-2100 [doi]

xLiD-Lexica: Cross-lingual Linked Data LexicaLei Zhang 0034, Michael Färber, Achim Rettinger. 2101-2105 [doi]

Turkish Resources for Visual Word RecognitionBegum Erten, Cem Bozsahin, Deniz Zeyrek. 2106-2110 [doi]

Computer-Aided Quality Assurance of an Icelandic Pronunciation DictionaryMartin Jansche. 2111-2114 [doi]

Bring vs. MTRoget: Evaluating automatic thesaurus translationLars Borin, Jens Allwood, Gerard de Melo. 2115-2121 [doi]

Bilingual Dictionary Induction as an Optimization ProblemWushouer Mairidan, Toru Ishida, Donghui Lin, Katsutoshi Hirayama. 2122-2129 [doi]

Enriching the "Senso Comune" Platform with Automatically Acquired DataTommaso Caselli, Laure Vieu, Carlo Strapparava, Guido Vetere. 2130-2137 [doi]

MUHIT: A Multilingual Harmonized DictionarySameh Alansary. 2138-2145 [doi]

Language Resources for French in the Biomedical DomainAurélie Névéol, Julien Grosjean, Stéfan Jacques Darmoni, Pierre Zweigenbaum. 2146-2151 [doi]

Gold-standard for Topic-specific Sentiment Analysis of Economic TextsPyry Takala, Pekka Malo, Ankur Sinha, Oskar Ahlgren. 2152-2157 [doi]

A decade of HLT Agency activities in the Low Countries: from resource maintenance (BLARK) to service offerings (BLAISE)Peter Spyns, Remco van Veenendaal. 2158-2165 [doi]

CLARA: A New Generation of Researchers in Common Language Resources and Their ApplicationsKoenraad De Smedt, Erhard W. Hinrichs, Detmar Meurers, Inguna Skadina, Bolette S. Pedersen, Costanza Navarretta, Núria Bel, Krister Lindén, Markéta Lopatková, Jan Hajic, Gisle Andersen, Przemyslaw Lenkiewicz. 2166-2174 [doi]

Encompassing a spectrum of LT users in the CLARIN-DK InfrastructureLina Henriksen, Dorte Haltrup Hansen, Bente Maegaard, Bolette Sandford Pedersen, Claus Povlsen. 2175-2181 [doi]

Legal aspects of text miningMaarten Truyens, Patrick van Eecke. 2182-2186 [doi]

CLARIN-NL: Major resultsJan Odijk. 2187-2193 [doi]

An Innovative World Language Centre : Challenges for the Use of Language TechnologyAuður Hauksdóttir. 2194-2198 [doi]

Facing the Identification Problem in Language-Related Scientific Data AnalysisJoseph Mariani, Christopher Cieri, Gil Francopoulo, Patrick Paroubek, Marine Delaborde. 2199-2205 [doi]

Taalportaal: an online grammar of Dutch and FrisianFrank Landsbergen, Carole Tiberius, Roderik Dernison. 2206-2210 [doi]

The USAGE review corpus for fine grained multi lingual opinion analysisRoman Klinger, Philipp Cimiano. 2211-2218 [doi]

PACE Corpus: a multilingual corpus of Polarity-annotated textual data from the domains Automotive and CEllphoneChristian Haenig, Andreas Niekler, Carsten Wuensch. 2219-2224 [doi]

Adapting Freely Available Resources to Build an Opinion Mining Pipeline in PortuguesePatrik Lambert, Carlos Rodríguez Penagos. 2225-2228 [doi]

The NewSoMe Corpus: A Unifying Opinion Annotation Framework across Genres and in Multiple LanguagesRoser Saurí Colomer, Judith Domingo, Toni Badia. 2229-2236 [doi]

The Dangerous Myth of the Star SystemAndré Bittar, Luca Dini, Sigrid Maurel, Mathieu Ruhlmann. 2237-2241 [doi]

A Corpus of Comparisons in Product ReviewsWiltrud Kessler, Jonas Kuhn. 2242-2248 [doi]

Finding Romanized Arabic Dialect in Code-Mixed TweetsClare R. Voss, Stephen Tratz, Jamal Laoudi, Douglas M. Briesch. 2249-2253 [doi]

Hashtag Occurrences, Layout and Translation: A Corpus-driven Analysis of Tweets Published by the Canadian GovernmentFabrizio Gotti, Philippe Langlais, Atefeh Farzindar. 2254-2261 [doi]

Clustering tweets usingWikipedia conceptsGuoyu Tang, Yunqing Xia, Weizhi Wang, Raymond Lau, Fang Zheng. 2262-2267 [doi]

An Arabic Twitter Corpus for Subjectivity and Sentiment AnalysisEshrag Refaee, Verena Rieser. 2268-2273 [doi]

TweetNorm_es: an annotated corpus for Spanish microtext normalizationIñaki Alegria, Nora Aranberri, Pere Comas, Víctor Fresno, Pablo Gamallo, Lluís Padró, Iñaki San Vicente, Jordi Turmo, Arkaitz Zubiaga. 2274-2278 [doi]

TweetCaT: a tool for building Twitter corpora of smaller languagesNikola Ljubesic, Darja Fiser, Tomaz Erjavec. 2279-2283 [doi]

A German Twitter SnapshotTatjana Scheffler. 2284-2289 [doi]

The Procedure of Lexico-Semantic Annotation of Składnica TreebankElzbieta Hajnicz. 2290-2297 [doi]

Deep Syntax Annotation of the Sequoia French TreebankMarie Candito, Guy Perrier, Bruno Guillaume, Corentin Ribeyre, Karën Fort, Djamé Seddah, Éric Villemonte de la Clergerie. 2298-2305 [doi]

Projection-based Annotation of a Polish Dependency TreebankAlina Wróblewska, Adam Przepiórkowski. 2306-2312 [doi]

Croatian Dependency Treebank 2.0: New Annotation Guidelines for Improved ParsingZeljko Agic, Dasa Berovic, Danijela Merkler, Marko Tadic. 2313-2319 [doi]

Correcting and Validating Syntactic Dependency in the Spoken French Treebank RhapsodieRachel Bawden, Marie-Amélie Botalla, Kim Gerdes, Sylvain Kahane. 2320-2325 [doi]

Because Size Does Matter: The Hamburg Dependency TreebankKilian A. Foth, Arne Köhn, Niels Beuck, Wolfgang Menzel. 2326-2333 [doi]

HamleDT 2.0: Thirty Dependency Treebanks StanfordizedRudolf Rosa, Jan Masek, David Marecek, Martin Popel, Daniel Zeman, Zdenek Zabokrtský. 2334-2341 [doi]

Bidirectionnal converter between syntactic annotations : from French Treebank Dependencies to PASSAGE annotations, and backMunshi Asadullah, Patrick Paroubek, Anne Vilnat. 2342-2347 [doi]

Developing an Egyptian Arabic Treebank: Impact of Dialectal Morphology on Annotation and Tool DevelopmentMohamed Maamouri, Ann Bies, Seth Kulick, Michael Ciul, Nizar Habash, Ramy Eskander. 2348-2354 [doi]

A Conventional Orthography for Tunisian ArabicInès Zribi, Rahma Boujelbane, Abir Masmoudi, Mariem Ellouze, Lamia Hadrich Belguith, Nizar Habash. 2355-2361 [doi]

Large Scale Arabic Error Annotation: Guidelines and FrameworkWajdi Zaghouani, Behrang Mohit, Nizar Habash, Ossama Obeid, Nadi Tomeh, Alla Rozovskaya, Noura Farra, Sarah Alkuhlani, Kemal Oflazer. 2362-2369 [doi]

Flow Graph Corpus from Recipe TextsShinsuke Mori, Hirokuni Maeta, Yoko Yamakata, Tetsuro Sasada. 2370-2377 [doi]

Recent Developments in DeReKoMarc Kupietz, Harald Lüngen. 2378-2385 [doi]

Why Chinese Web-as-Corpus is Wacky? Or: How Big Data is Killing Chinese Corpus LinguisticsShu-Kai Hsieh. 2386-2389 [doi]

Extending HeidelTime for Temporal Expressions Referring to Historic DatesJannik Strötgen, Thomas Bögel, Julian Zell, Ayser Armiti, Tran Van Canh, Michael Gertz. 2390-2397 [doi]

A 500 Million Word POS-Tagged Icelandic CorpusThomas Eckart, Erla Hallsteinsdóttir, Sigrún Helgadóttir, Uwe Quasthoff, Dirk Goldhahn. 2398-2402 [doi]

Building The Sense-Tagged Multilingual Parallel CorpusShan Wang, Francis Bond. 2403-2409 [doi]

A Hindi-English Code-Switching CorpusAnik Dey, Pascale Fung. 2410-2413 [doi]

KoKo: an L1 Learner Corpus for GermanAndrea Abel, Aivars Glaznieks, Lionel Nicolas, Egon Stemle. 2414-2421 [doi]

On Paraphrase Identification CorporaVasile Rus, Rajendra Banjade, Mihai C. Lintean. 2422-2429 [doi]

Construction and Annotation of a French Folkstale CorpusAnne Garcia-Fernandez, Anne-Laure Ligozat, Anne Vilnat. 2430-2435 [doi]

Statistical Analysis of Multilingual Text Corpus and Development of Language ModelsShyam Sundar Agrawal, Abhimanue, Shweta Bansal, Minakshi Mahajan. 2436-2440 [doi]

Building a Dataset for Summarization and Keyword Extraction from EmailsVanessa Loza, Shibamouli Lahiri, Rada Mihalcea, Po-Hsiang Lai. 2441-2446 [doi]

Language CoLLAGE: Grammatical Description with the LinGO Grammar MatrixEmily M. Bender. 2447-2451 [doi]

To Pay or to Get Paid: Enriching a Valency Lexicon with DiathesesAnna Vernerová, Václava Kettnerová, Markéta Lopatková. 2452-2459 [doi]

The Ellogon Pattern Engine: Context-free Grammars over AnnotationsGeorgios Petasis. 2460-2465 [doi]

Extracting a bilingual semantic grammar from FrameNet-annotated corporaDana Dannélls, Normunds Gruzitis. 2466-2473 [doi]

Relating Frames and Constructions in Japanese FrameNetKyoko Ohara. 2474-2477 [doi]

MultiVal - towards a multilingual valence lexiconLars Hellan, Dorothee Beermann, Tore Bruland, Mary Esther Kropp Dakubu, Montserrat Marimon. 2478-2485 [doi]

A Vector Space Model for Syntactic Distances Between DialectsEmanuele Di Buccio, Giorgio Maria Di Nunzio, Gianmaria Silvello. 2486-2489 [doi]

Resources in Conflict: A Bilingual Valency Lexicon vs. a Bilingual Treebank vs. a Linguistic TheoryJana Sindlerová, Zdenka Uresová, Eva Fucíková. 2490-2494 [doi]

A Multi-Cultural Repository of Automatically Discovered Linguistic and Conceptual MetaphorsSamira Shaikh, Tomek Strzalkowski, Ting Liu, George Aaron Broadwell, Boris Yamrom, Sarah M. Taylor, Laurie Feldman, Kit Cho, Umit Boz, Ignacio Cases, Yuliya Peshkova, Ching-Sheng Lin. 2495-2500 [doi]

Two Approaches to Metaphor DetectionBrian MacWhinney, Davida Fromm. 2501-2506 [doi]

Mining Online Discussion Forums for MetaphorsAndrew Gargett, John A. Barnden. 2507-2512 [doi]

Simple Effective Microblog Named Entity Recognition: Arabic as an ExampleKareem Darwish, Wei Gao. 2513-2517 [doi]

Biomedical entity extraction using machine-learning based approachesCyril Grouin. 2518-2523 [doi]

NoSta-D Named Entity Annotation for German: Guidelines and DatasetDarina Benikova, Chris Biemann, Marc Reznicek. 2524-2531 [doi]

Comparison of the Impact of Word Segmentation on Name Tagging for Chinese and JapaneseHaibo Li 0004, Masato Hagiwara, Qi Li, Heng Ji. 2532-2536 [doi]

HFST-SweNER ― A New NER Resource for SwedishDimitrios Kokkinakis, Jyrki Niemi, Sam Hardwick, Krister Lindén, Lars Borin. 2537-2543 [doi]

Crowdsourcing and annotating NER for Twitter #driftHege Fromreide, Dirk Hovy, Anders Søgaard. 2544-2547 [doi]

Clustering of Multi-Word Named Entity variants: Multilingual EvaluationGuillaume Jacquet, Maud Ehrmann, Ralf Steinberger. 2548-2553 [doi]

Comparative Analysis of Portuguese Named Entities Recognition ToolsDaniela Amaral, Evandro Brasil da Fonseca, Lucelene Lopes, Renata Vieira. 2554-2558 [doi]

Generating a Resource for Products and Brandnames Recognition. Application to the Cosmetic DomainCédric Lopez, Frédérique Segond, Olivier Hondermarck, Paolo Curtoni, Luca Dini. 2559-2564 [doi]

Named Entity Corpus Construction using Wikipedia and DBpedia OntologyYoungGyun Hahm, Jungyeul Park, Kyungtae Lim, Youngsik Kim, Dosam Hwang, Key-Sun Choi. 2565-2569 [doi]

Exploring the utility of coreference chains for improved identification of personal namesAndrea Glaser, Jonas Kuhn. 2570-2577 [doi]

Named Entity Tagging a Very Large Unbalanced Corpus: Training and Evaluating NE ClassifiersJoachim Bingel, Thomas Haider. 2578-2583 [doi]

REFRACTIVE: An Open Source Tool to Extract Knowledge from Syntactic and Semantic RelationsPeter Exner, Pierre Nugues. 2584-2589 [doi]

Overview of Todai Robot Project and Evaluation Framework of its NLP-based Problem SolvingAkira Fujita, Akihiro Kameda, Ai Kawazoe, Yusuke Miyao. 2590-2597 [doi]

Annotating Question Decomposition on Complex Medical QuestionsKirk Roberts, Kate Masterton, Marcelo Fiszman, Halil Kilicoglu, Dina Demner-Fushman. 2598-2602 [doi]

JUST.ASK, a QA system that learns to answer new questions from previous interactionsSérgio Curto, Ana Cristina Mendes, Pedro Curto, Luísa Coheur, Ângela Costa. 2603-2607 [doi]

Extraction of Daily Changing Words for Question AnsweringKugatsu Sadamitsu, Ryuichiro Higashinaka, Yoshihiro Matsuo. 2608-2612 [doi]

LinkedHealthAnswers: Towards Linked Data-driven Question Answering for the Health Care DomainArtem Ostankov, Florian Röhrbein, Ulli Waltinger. 2613-2620 [doi]

A tool suite for creating question answering benchmarksAxel-Cyrille Ngonga Ngomo, Norman Heino, René Speck, Prodromos Malakasiotis. 2621-2628 [doi]

The DIRHA simulated corpusLuca Cristoforetti, Mirco Ravanelli, Maurizio Omologo, Alessandro Sosi, Alberto Abad, Martin Hagmueller, Petros Maragos. 2629-2634 [doi]

Euronews: a multilingual speech corpus for ASRRoberto Gretter. 2635-2638 [doi]

Towards Multilingual Conversations in the Medical Domain: Development of Multilingual Medical Data and A Network-based ASR SystemSakriani Sakti, Keigo Kubo, Sho Matsumiya, Graham Neubig, Tomoki Toda, Satoshi Nakamura, Fumihiro Adachi, Ryosuke Isotani. 2639-2643 [doi]

The Slovene BNSI Broadcast News database and reference speech corpus GOS: Towards the uniform guidelines for future workAndrej Zgank, Ana Zwitter Vitez, Darinka Verdonik. 2644-2647 [doi]

Aix Map Task corpus: The French multimodal corpus of task-oriented dialogueJan Gorisch, Corine Astésano, Ellen Gurman Bard, Brigitte Bigi, Laurent Prévot. 2648-2652 [doi]

CORILGA: a Galician Multilevel Annotated Speech Corpus for Linguistic AnalysisCarmen García-Mateo, Antonio Cardenal López, Xose Luis Regueira, Elisa Fernández Rei, Marta Martinez, Roberto Seara, Rocío Varela, Noemí Basanta. 2653-2657 [doi]

Basque Speecon-like and Basque SpeechDat MDB-600: speech databases for the development of ASR technology for BasqueIgor Odriozola, Inma Hernáez, María Inés Torres, Luis Javier Rodríguez-Fuentes, Mikel Peñagarikano, Eva Navas. 2658-2665 [doi]

New bilingual speech databases for audio diarizationDavid Tavarez, Eva Navas, Daniel Erro, Ibon Saratxaga, Inma Hernáez. 2666-2670 [doi]

Erlangen-CLP: A Large Annotated Corpus of Speech from Children with Cleft Lip and PalateTobias Bocklet, Andreas K. Maier, Korbinian Riedhammer, Ulrich Eysholdt, Elmar Nöth. 2671-2674 [doi]

The Development of the Multilingual LUNA Corpus for Spoken Language System PortingEvgeny A. Stepanov, Giuseppe Riccardi, Ali Orkan Bayer. 2675-2678 [doi]

The taraXÜ corpus of human-annotated machine translationsEleftherios Avramidis, Aljoscha Burchardt, Sabine Hunsicker, Maja Popovic, Cindy Tscherwinka, David Vilar, Hans Uszkoreit. 2679-2682 [doi]

Measuring the Impact of Spelling Errors on the Quality of Machine TranslationIrina Galinskaya, Valentin Gusev, Elena Mescheryakova, Mariya Shmatova. 2683-2689 [doi]

A Quality-based Active Sample Selection Strategy for Statistical Machine TranslationVarvara Logacheva, Lucia Specia. 2690-2695 [doi]

A Comparison of MT Errors and ESL ErrorsHoma B. Hashemi, Rebecca Hwa. 2696-2700 [doi]

VERTa: Facing a Multilingual Experience of a Linguistically-based MT EvaluationElisabet Comelles, Jordi Atserias, Victoria Arranz, Irene Castellón, Jordi Sesé. 2701-2707 [doi]

ASR-based CALL systems and learner speech data: new resources and opportunities for research and development in second language learningCatia Cucchiarini, Steve Bodnar, Bart Penning de Vries, Roeland Van Hout, Helmer Strik. 2708-2714 [doi]

The Dutch LESLLA CorpusEric Sanders, Ineke van de Craats, Vanja de Lint. 2715-2718 [doi]

Student achievement and French sentence repetition test scoresDeryle Lonsdale, Benjamin Millard. 2719-2725 [doi]

USING A SERIOUS GAME TO COLLECT A CHILD LEARNER SPEECH CORPUSClaudia Baur, Manny Rayner, Nikos Tsourakis. 2726-2732 [doi]

Sprinter: Language Technologies for Interactive and Multimedia Language LearningRenlong Ai, Marcela Charfuelan, Walter Kasper, Tina Klüwer, Hans Uszkoreit, Feiyu Xu, Sandra Gasber, Philip Gienandt. 2733-2738 [doi]

Automatic semantic relation extraction from Portuguese textsLeonardo Sameshima Taba, Helena de Medeiros Caseli. 2739-2746 [doi]

Estimation of Speaking Style in Speech Corpora Focusing on speech transcriptionsRaymond Shen, Hideaki Kikuchi. 2747-2752 [doi]

Annotating Clinical Events in Text Snippets for Phenotype DetectionPrescott Klassen, Fei Xia, Lucy Vanderwende, Meliha Yetisgen. 2753-2757 [doi]

Annotating Inter-Sentence Temporal Relations in Clinical NotesJennifer D'Souza, Vincent Ng. 2758-2765 [doi]

CHARACTERIZING AND PREDICTING BURSTY EVENTS: THE BUZZ CASE STUDY ON TWITTERMohamed Morchid, Georges Linares, Richard Dufour. 2766-2771 [doi]

Building Domain Specific Bilingual DictionariesLucas Welter Hilgert, Lucelene Lopes, Artur Freitas, Renata Vieira, Denise Hogetop, Aline A. Vanin. 2772-2777 [doi]

DeLex, a freely-avaible, large-scale and linguistically grounded morphological lexicon for GermanBenoît Sagot. 2778-2784 [doi]

Walenty: Towards a comprehensive valence dictionary of PolishAdam Przepiórkowski, Elzbieta Hajnicz, Agnieszka Patejuk, Marcin Wolinski, Filip Skwarski, Marek Swidzinski. 2785-2792 [doi]

A Language-independent Approach to Extracting Derivational Relations from an Inflectional LexiconMarion Baranes, Benoît Sagot. 2793-2799 [doi]

Automatic Expansion of the MRC Psycholinguistic Database Imageability RatingsTing Liu, Kit Cho, George Aaron Broadwell, Samira Shaikh, Tomek Strzalkowski, John Lien, Sarah M. Taylor, Laurie Feldman, Boris Yamrom, Nick Webb, Umit Boz, Ignacio Cases, Ching-Sheng Lin. 2800-2805 [doi]

Mapping the Lexique des Verbes du FrancÌ§ais (Lexicon of French Verbs) to a NLP lexicon using examplesBruno Guillaume, Karën Fort, Guy Perrier, Paul Bédaride. 2806-2810 [doi]

Text Readability and Word Distribution in JapaneseSatoshi Sato. 2811-2815 [doi]

High Quality Word Lists as a Resource for Multiple PurposesUwe Quasthoff, Dirk Goldhahn, Thomas Eckart, Erla Hallsteinsdóttir, Sabine Fiedler. 2816-2819 [doi]

ISLEX ― a Multilingual Web DictionaryÞórdís Úlfarsdóttir. 2820-2825 [doi]

Automatic Mapping Lexical Resources: A Lexical Unit as the KeystoneEduard Bejcek, Václava Kettnerová, Markéta Lopatková. 2826-2832 [doi]

Towards Electronic SMS Dictionary Construction: An Alignment-based ApproachCédric Lopez, Reda Bestandji, Mathieu Roche, Rachel Panckhurst. 2833-2838 [doi]

Bilingual dictionaries for all EU languagesAhmet Aker, Monica Lestari Paramita, Marcis Pinnis, Robert J. Gaizauskas. 2839-2845 [doi]

Automatic acquisition of Urdu nouns (along with gender and irregular plurals)Tafseer Ahmed. 2846-2850 [doi]

NomLex-PT: A Lexicon of Portuguese NominalizationsValeria de Paiva, Livy Real, Alexandre Rademaker, Gerard de Melo. 2851-2858 [doi]

Sentence Rephrasing for Parsing Sentences with OOV WordsHen-Hsen Huang, Huan-Yuan Chen, Chang-Sheng Yu, Hsin-Hsi Chen, Po-Ching Lee, Chun-Hsun Chen. 2859-2862 [doi]

Pruning the Search Space of the Wolof LFG Grammar Using a Probabilistic and a Constraint Grammar ParserCheikh M. Bamba Dione. 2863-2870 [doi]

How Could Veins Speed Up The Process Of Discourse ParsingElena Mitocariu, Daniel Alexandru Anechitei, Dan Cristea. 2871-2878 [doi]

Parsing Heterogeneous Corpora with a Rich Dependency GrammarAchim Stein. 2879-2886 [doi]

Treelet Probabilities for HPSG Parsing and Error CorrectionAngelina Ivanova, Gertjan van Noord. 2887-2892 [doi]

Self-training a Constituency Parser using n-gram TreesArda Çelebi, Arzucan Özgür. 2893-2896 [doi]

A Gold Standard Dependency Corpus for EnglishNatalia Silveira, Timothy Dozat, Marie-Catherine de Marneffe, Samuel R. Bowman, Miriam Connor, John Bauer, Christopher D. Manning. 2897-2904 [doi]

Discosuite - A parser test suite for German discontinuous structuresWolfgang Maier, Miriam Kaeshammer, Peter Baumann, Sandra Kübler. 2905-2912 [doi]

SWIFT Aligner, A Multifunctional Tool for Parallel Corpora: Visualization, Word Alignment, and (Morpho)-Syntactic Cross-Language TransferTimur Gilmanov, Olga Scrivner, Sandra Kübler. 2913-2919 [doi]

The CLE Urdu POS TagsetSaba Urooj, Sarmad Hussain, Asad Mustafa, Rahila Parveen, Farah Adeeba, Tafseer Ahmed, Miriam Butt, Annette Hautli. 2920-2925 [doi]

Using Stem-Templates to Improve Arabic POS and Gender/Number TaggingKareem Darwish, Ahmed Abdelali, Hamdy Mubarak. 2926-2931 [doi]

The LIMA Multilingual Analyzer Made Free: FLOSS Resources Adaptation and CorrectionGaël de Chalendar. 2932-2937 [doi]

A Tagged Corpus and a Tagger for UrduBushra Jawaid, Amir Kamran, Ondrej Bojar. 2938-2943 [doi]

Correcting Errors in a New Gold Standard for Tagging Icelandic TextSigrún Helgadóttir, Hrafn Loftsson, Eiríkur Rögnvaldsson. 2944-2948 [doi]

PoliTa: A multitagger for PolishLukasz Kobylinski. 2949-2954 [doi]

Polysemy Index for Nouns: an Experiment on Italian using the PAROLE SIMPLE CLIPS Lexical DatabaseFrancesca Frontini, Valeria Quochi, Sebastian Padó, Monica Monachini, Jason Utt. 2955-2963 [doi]

Comparing Similarity Measures for Distributional ThesauriMuntsa Padró, Marco Idiart, Aline Villavicencio, Carlos Ramisch. 2964-2971 [doi]

Reconstructing the Semantic Landscape of Natural Language ProcessingElisa Omodei, Jean-Philippe Cointet, Thierry Poibeau. 2972-2978 [doi]

Compounds and distributional thesauriOlivier Ferret. 2979-2984 [doi]

UnixMan Corpus: A Resource for Language Learning in the Unix DomainKyle Richardson, Jonas Kuhn. 2985-2989 [doi]

Multilingual eXtended WordNet Knowledge Base: Semantic Parsing and Translation of GlossesTatiana N. Erekhinskaya, Meghana Satpute, Dan I. Moldovan. 2990-2994 [doi]

Relation Inference in Lexical Networks ... with RefinementsManel Zarrouk, Mathieu Lafourcade. 2995-3000 [doi]

Extracting semantic relations from Portuguese corpora using lexical-syntactic patternsRaquel Amaro. 3001-3005 [doi]

An analysis of ambiguity in word sense annotationsDavid Jurgens. 3006-3012 [doi]

PropBank: Semantics of New Predicate TypesClaire Bonial, Julia Bonn, Kathryn Conger, Jena D. Hwang, Martha Palmer. 3013-3019 [doi]

Semi-supervised methods for expanding psycholinguistics norms by integrating distributional similarity with the structure of WordNetMichael Mohler, Marc T. Tomlinson, David B. Bracewell, Bryan Rink. 3020-3026 [doi]

A Graph-Based Approach for Computing Free Word AssociationsGemma Bel Enguix, Reinhard Rapp, Michael Zock. 3027-3033 [doi]

A hierarchical taxonomy for classifying hardness of inference tasksMartin Gleize, Brigitte Grau. 3034-3040 [doi]

Speech Recognition Web Services for DutchJoris Pelemans, Kris Demuynck, Hugo Van Hamme, Patrick Wambacq. 3041-3044 [doi]

Morpho-Syntactic Study of Errors from Speech Recognition SystemMaria Goryainova, Cyril Grouin, Sophie Rosset, Ioana Vasilescu. 3045-3049 [doi]

Human annotation of ASR error regions: Is "gravity" a sharable concept for human annotators?Daniel Luzzati, Cyril Grouin, Ioana Vasilescu, Martine Adda-Decker, Eric Bilinski, Nathalie Camelin, Juliette Kahn, Carole Lailler, Lori Lamel, Sophie Rosset. 3050-3056 [doi]

Development of a TV Broadcasts Speech Recognition System for Qatari ArabicMohamed Elmahdy, Mark Hasegawa-Johnson, Eiman Mustafawi. 3057-3061 [doi]

Automatic Long Audio Alignment and Confidence Scoring for Conversational Arabic SpeechMohamed Elmahdy, Mark Hasegawa-Johnson, Eiman Mustafawi. 3062-3066 [doi]

The WaveSurfer Automatic Speech Recognition PluginGiampiero Salvi, Niklas Vanhainen. 3067-3071 [doi]

A Toolkit for Efficient Learning of Lexical Units for Speech RecognitionMatti Varjokallio, Mikko Kurimo. 3072-3075 [doi]

Using Audio Books for Training a Text-to-Speech SystemAimilios Chalamandaris, Pirros Tsiakoulis, Sotiris Karabetsos, Spyros Raptis. 3076-3080 [doi]

CLiPS Stylometry Investigation (CSI) corpus: A Dutch corpus for the detection of age, gender, personality, sentiment and deception in textBen Verhoeven, Walter Daelemans. 3081-3085 [doi]

Building and Modelling Multilingual Subjective CorporaMotaz Saad, David Langlois, Kamel Smaïli. 3086-3091 [doi]

Author-Specific Sentiment Aggregation for Polarity Prediction of ReviewsSubhabrata Mukherjee, Sachindra Joshi. 3092-3099 [doi]

Meta-Classifiers Easily Improve Commercial Sentiment Detection ToolsMark Cieliebak, Oliver Dürr, Fatih Uzdilli. 3100-3104 [doi]

AusTalk: an audio-visual corpus of Australian EnglishDominique Estival, Steve Cassidy, Felicity Cox, Denis Burnham. 3105-3109 [doi]

From Synsets to Videos: Enriching ItalWordNet MultimodallyRoberto Bartolini, Valeria Quochi, Irene De Felice, Irene Russo, Monica Monachini. 3110-3117 [doi]

A Multimodal Dataset for Deception DetectionVerónica Pérez-Rosas, Rada Mihalcea, Alexis Narvaez, Mihai Burzo. 3118-3122 [doi]

The Distress Analysis Interview Corpus of human and computer interviewsJonathan Gratch, Ron Artstein, Gale M. Lucas, Giota Stratou, Stefan Scherer, Angela Nazarian, Rachel Wood, Jill Boberg, David DeVault, Stacy Marsella, David R. Traum, Skip Rizzo, Louis-Philippe Morency. 3123-3128 [doi]

Modern Chinese Helps Archaic Chinese Processing: Finding and Exploiting the Shared PropertiesYan Song, Fei Xia. 3129-3136 [doi]

Linguistic landscaping of South Asia using digital language resources: Genetic vs. areal linguisticsLars Borin, Anju Saxena, Taraka Rama, Bernard Comrie. 3137-3144 [doi]

PanLex: Building a Resource for Panlingual Lexical TranslationDavid Kamholz, Jonathan Pool, Susan M. Colowick. 3145-3150 [doi]

Enriching ODINFei Xia, William D. Lewis, Michael Wayne Goodman, Joshua Crowgey, Emily M. Bender. 3151-3157 [doi]

Creating a massively parallel Bible corpusThomas Mayer, Michael Cysouw. 3158-3163 [doi]

DCEP -Digital Corpus of the European ParliamentNajeh Hajlaoui, David Kolovratník, Jaakko Väyrynen, Ralf Steinberger, Dániel Varga. 3164-3171 [doi]

Innovations in Parallel Corpus Search ToolsMartin Volk, Johannes Graën, Elena Callegaro. 3172-3178 [doi]

An Open-Source Heavily Multilingual Translation Graph Extracted from Wiktionaries and Parallel CorporaValérie Hanoka, Benoît Sagot. 3179-3186 [doi]

Corpus for Coreference Resolution on Scientific PapersPanot Chaimongkol, Akiko Aizawa, Yuka Tateisi. 3187-3190 [doi]

ParCor 1.0: A Parallel Pronoun-Coreference Corpus to Support Statistical MTLiane Guillou, Christian Hardmeier, Aaron Smith, Jörg Tiedemann, Bonnie L. Webber. 3191-3198 [doi]

The DARE Corpus: A Resource for Anaphora Resolution in Dialogue Based Intelligent Tutoring SystemsNobal B. Niraula, Vasile Rus, Rajendra Banjade, Dan Stefanescu, William Baggett, Brent Morgan. 3199-3203 [doi]

CROMER: a Tool for Cross-Document Event and Entity CoreferenceChristian Girardi, Manuela Speranza, Rachele Sprugnoli, Sara Tonelli. 3204-3208 [doi]

Coreference Resolution for LatvianArturs Znotins, Peteris Paikens. 3209-3213 [doi]

An Exercise in Reuse of Resources: Adapting General Discourse Coreference Resolution for Detecting Lexical Chains in Patent DocumentationNadjet Bouayad-Agha, Alicia Burga, Gerard Casamayor, Joan Codina, Rogelio Nazar, Leo Wanner. 3214-3221 [doi]

The Extended DIRNDL Corpus as a Resource for Coreference and Bridging ResolutionAnders Björkelund, Kerstin Eckart, Arndt Riester, Nadja Schauffler, Katrin Schweitzer. 3222-3228 [doi]

Multilingual corpora with coreferential annotation of person entitiesMarcos García, Pablo Gamallo. 3229-3233 [doi]

Polish Coreference Corpus in NumbersMaciej Ogrodniczuk, Mateusz Kopec, Agata Savary. 3234-3238 [doi]

French Resources for Extraction and Normalization of Temporal Expressions with HeidelTimeVéronique Moriceau, Xavier Tannier. 3239-3243 [doi]

Multilingual Test Sets for Machine Translation of Search Queries for Cross-Lingual Information Retrieval in the Medical DomainZdenka Uresová, Jan Hajic, Pavel Pecina, Ondrej Dusek. 3244-3247 [doi]

Semantic approaches to software component retrieval with English queriesHuijing Deng, Grzegorz Chrupala. 3248-3252 [doi]

Annotating Relation Mentions in Tabloid PressHong Li, Sebastian Krause, Feiyu Xu, Hans Uszkoreit, Robert Hummel, Veselina Mironova. 3253-3257 [doi]

Construction of Diachronic Ontologies from People's Daily of Fifty YearsShaoda He, Xiaojun Zou, Liumingjing Xiao, Junfeng Hu. 3258-3263 [doi]

Use of unsupervised word classes for entity recognition: Application to the detection of disorders in clinical reportsMaria Evangelia Chatzimina, Cyril Grouin, Pierre Zweigenbaum. 3264-3271 [doi]

The Weltmodell: A Data-Driven Commonsense Knowledge BaseAlan Akbik, Thilo Michael. 3272-3276 [doi]

Discovering and Visualising Stories in NewsMarieke van Erp, Gleb Satyukov, Piek Vossen, Marit Nijsen. 3277-3282 [doi]

A Large Scale Database of Strongly-related Events in JapaneseTomohide Shibata, Shotaro Kohama, Sadao Kurohashi. 3283-3288 [doi]

ClearTK 2.0: Design Patterns for Machine Learning in UIMASteven Bethard, Philip V. Ogren, Lee Becker. 3289-3293 [doi]

Vocabulary-Based Language Similarity using Web CorporaDirk Goldhahn, Uwe Quasthoff. 3294-3299 [doi]

Automatic language identity tagging on word and sentence-level in multilingual text sources: a case-study on LuxembourgishThomas Lavergne, Gilles Adda, Martine Adda-Decker, Lori Lamel. 3300-3304 [doi]

VarClass: An Open-source Language Identification Tool for Language VarietiesMarcos Zampieri, Binyam Gebrekidan Gebre. 3305-3308 [doi]

Native Language Identification Using Large, Longitudinal DataXiao Jiang, Yufan Guo, Jeroen Geertzen, Dora Alexopoulou, Lin Sun, Anna Korhonen. 3309-3312 [doi]

On the Romance Languages Mutual IntelligibilityLiviu P. Dinu, Alina Maria Ciobanu. 3313-3318 [doi]

Heuristic Hyper-minimization of Finite State LexiconsSenka Drobac, Krister Lindén, Tommi A. Pirinen, Miikka Silfverberg. 3319-3324 [doi]

Crowd-sourcing evaluation of automatically acquired, morphologically related word groupingsClaudia Borg, Albert Gatt. 3325-3332 [doi]

Morphological parsing of Swahili using crowdsourced lexical resourcesPatrick Littell, Kaitlyn Price, Lori S. Levin. 3333-3339 [doi]

Chasing the Perfect Splitter: A Comparison of Different Compound Splitting ToolsCarla Parra Escartín. 3340-3347 [doi]

Generating and using probabilistic morphological resources for the biomedical domainVincent Claveau, Ewa Kijak. 3348-3354 [doi]

Using Resource-Rich Languages to Improve Morphological Analysis of Under-Resourced LanguagesPeter Baumann, Janet B. Pierrehumbert. 3355-3359 [doi]

Turkish Treebank as a Gold Standard for Morphological Disambiguation and Its Influence on ParsingÖzlem Çetinoglu. 3360-3365 [doi]

CroDeriV: a new resource for processing Croatian morphologyKresimir Sojat, Matea Srebacic, Marko Tadic, Tin Pavelic. 3366-3370 [doi]

DerivBase.hr: A High-Coverage Derivational Morphology Resource for CroatianJan Snajder. 3371-3377 [doi]

Finite-state morphological transducers for three Kypchak languagesJonathan Washington, Ilnar Salimzyanov, Francis M. Tyers. 3378-3385 [doi]

Representing Multimodal Linguistic Annotated dataBrigitte Bigi, Tatsuya Watanabe, Laurent Prévot. 3386-3392 [doi]

Single-Person and Multi-Party 3D Visualizations for Nonverbal Communication AnalysisMichael Kipp, Levin Freiherr von Hollen, Michael Christopher Hrstka, Franziska Zamponi. 3393-3397 [doi]

The AV-LASYN Database : A synchronous corpus of audio and 3D facial marker data for audio-visual laughter synthesisHüseyin Çakmak, Jérôme Urbain, Thierry Dutoit, Joëlle Tilmanne. 3398-3403 [doi]

Linking Pictographs to Synsets: Sclera2CornettoVincent Vandeghinste, Ineke Schuurman. 3404-3410 [doi]

The MMASCS multi-modal annotated synchronous corpus of audio, video, facial motion and tongue motion data of normal, fast and slow speechDietmar Schabus, Michael Pucher, Phil Hoole. 3411-3416 [doi]

Mining a multimodal corpus for non-verbal behavior sequences conveying attitudesMathieu Chollet, Magalie Ochs, Catherine Pelachaud. 3417-3424 [doi]

The IMAGACT Visual Ontology. An Extendable Multilingual Infrastructure for the representation of lexical encoding of ActionMassimo Moneglia, Susan Brown, Francesca Frontini, Gloria Gagliardi, Fahad Khan, Monica Monachini, Alessandro Panunzi. 3425-3432 [doi]

Multimodal dialogue segmentation with gesture post-processingKodai Takahashi, Masashi Inoue. 3433-3437 [doi]

The D-ANS corpus: the Dublin-Autonomous Nervous System corpus of biosignal and multimodal recordings of conversational speechShannon Hennig, Ryad Chellali, Nick Campbell. 3438-3443 [doi]

A Crowdsourcing Smartphone Application for Swiss German: Putting Language Documentation in the Hands of the UsersJean Philippe Goldman, Adrian Leemann, Marie-José Kolly, Ingrid Hove, Ibrahim Almajai, Volker Dellwo, Steven Moran. 3444-3447 [doi]

TagNText: A parallel corpus for the induction of resource-specific non-taxonomical relations from tagged imagesTheodosia Togia, Ann A. Copestake. 3448-3455 [doi]

Crowdsourcing for Evaluating Machine Translation QualityShinsuke Goto, Donghui Lin, Toru Ishida. 3456-3463 [doi]

NOMAD: Linguistic Resources and Tools Aimed at Policy Formulation and ValidationGeorge Kiomourtzis, George Giannakopoulos, Georgios Petasis, Pythagoras Karampiperis, Vangelis Karkaletsis. 3464-3470 [doi]

sloWCrowd: A crowdsourcing tool for lexicographic tasksDarja Fiser, Ales Tavcar, Tomaz Erjavec. 3471-3475 [doi]

Comparison of Gender- and Speaker-adaptive Emotion RecognitionMaxim Sidorov, Stefan Ultes, Alexander Schmitt. 3476-3480 [doi]

Speech-Based Emotion Recognition: Feature Selection by Self-Adaptive Multi-Criteria Genetic AlgorithmMaxim Sidorov, Christina Brester, Wolfgang Minker, Eugene Semenkin. 3481-3485 [doi]

Emilya: Emotional body expression in daily actions databaseNesrine Fourati, Catherine Pelachaud. 3486-3493 [doi]

TexAFon 2.0: A text processing tool for the generation of expressive speech in TTS applicationsJuan María Garrido, Yesika Laplaza, Benjamin Kolz, Miquel Cornudella. 3494-3500 [doi]

EMOVO Corpus: an Italian Emotional Speech DatabaseGiovanni Costantini, Iacopo Iaderola, Andrea Paoloni, Massimiliano Todisco. 3501-3504 [doi]

A Database of Full Body Virtual Interactions Annotated with Expressivity ScoresDemulier Virginie, Elisabetta Bevacqua, Florian Focone, Tom Giraud, Pamela Carreno, Brice Isableu, Sylvie Gibet, Pierre De Loor, Jean-Claude Martin. 3505-3510 [doi]

Annotating Events in an Emotion CorpusSophia Yat Mei Lee, Shoushan Li, Chu-Ren Huang. 3511-3516 [doi]

Towards Linked Hypernyms Dataset 2.0: complementing DBpedia with hypernym discoveryTomás Kliegr, Ondrej Zamazal. 3517-3523 [doi]

NIF4OGGD - NLP Interchange Format for Open German Governmental DataMohamed Ahmed Sherif, Sandro Coelho, Ricardo Usbeck, Sebastian Hellmann, Jens Lehmann, Martin Brümmer, Andreas Both. 3524-3528 [doi]

N³ - A Collection of Datasets for Named Entity Recognition and Disambiguation in the NLP Interchange FormatMichael Röder, Ricardo Usbeck, Sebastian Hellmann, Daniel Gerber, Andreas Both. 3529-3533 [doi]

The LRE Map disclosedRiccardo Del Gratta, Gabriella Pardelli, Sara Goggi. 3534-3541 [doi]

Accommodations in Tuscany as Linked DataClara Bacciu, Angelica Lo Duca, Andrea Marchetti, Maurizio Tesconi. 3542-3545 [doi]

Global Intelligent Content: Active Curation of Language Resources using Linked DataDavid Lewis, Rob Brennan, Leroy Finn, Dominic Jones, Alan Meehan, Declan O'Sullivan, Sebastian Hellmann, Felix Sasaki. 3546-3549 [doi]

HindEnCorp - Hindi-English and Hindi-only Corpus for Machine TranslationOndrej Bojar, Vojtech Diatka, Pavel Rychlý, Pavel Stranák, Vit Suchomel, Ales Tamchyna, Daniel Zeman. 3550-3555 [doi]

Online optimisation of log-linear weights in interactive machine translationMara Chinea-Rios, Germán Sanchis-Trilles, Daniel Ortiz-Martínez, Francisco Casacuberta. 3556-3559 [doi]

An efficient and user-friendly tool for machine translation quality estimationKashif Shah, Marco Turchi, Lucia Specia. 3560-3564 [doi]

Word Alignment-Based Reordering of Source Chunks in PB-SMTSantanu Pal, Sudip Kumar Naskar, Sivaji Bandyopadhyay. 3565-3571 [doi]

Comparing the Quality of Focused Crawlers and of the Translation Resources Obtained from themBruno Laranjeira, Viviane Moreira, Aline Villavicencio, Carlos Ramisch, Maria José Finatto. 3572-3578 [doi]

N-gram Counts and Language Models from the Common CrawlChristian Buck, Kenneth Heafield, Bas van Ooyen. 3579-3584 [doi]

A Corpus of Machine Translation Errors Extracted from Translation Students ExercisesGuillaume Wisniewski, Natalie Kübler, François Yvon. 3585-3588 [doi]

Pre-ordering of phrase-based machine translation input in translation workflowAlexandru Ceausu, Sabine Hunsicker. 3589-3592 [doi]

A Wikipedia-based Corpus for Contextualized Machine TranslationJennifer Drexler, Pushpendre Rastogi, Jacqueline Aguilar, Benjamin Van Durme, Matt Post. 3593-3596 [doi]

Transfer learning of feedback head expressions in Danish and Polish comparable multimodal corporaCostanza Navarretta, Magdalena Lis. 3597-3603 [doi]

Improving the exploitation of linguistic annotations in ELANOnno Crasborn, Han Sloetjes. 3604-3608 [doi]

Web-imageability of the Behavioral Features of Basic-level ConceptsYoshihiko Hayashi. 3609-3614 [doi]

A model to generate adaptive multimodal job interviews with a virtual recruiterZoraida Callejas, Brian Ravenet, Magalie Ochs, Catherine Pelachaud. 3615-3619 [doi]

A multimodal interpreter for 3D visualization and animation of verbal conceptsColine Claude-Lachenaud, Eric Charton, Benoît Ozell, Michel Gagnon. 3620-3627 [doi]

New functions for a multipurpose multimodal tool for phonetic and linguistic analysis of very large speech corporaPhilippe Martin. 3628-3632 [doi]

Smile and Laughter in Human-Machine Interaction: a study of engagementMariette Soury, Laurence Devillers. 3633-3637 [doi]

ALICO: a multimodal corpus for the study of active listeningHendrik Buschmeier, Zofia Malisz, Joanna Skubisz, Marcin Wlodarczak, Ipke Wachsmuth, Stefan Kopp, Petra Wagner. 3638-3643 [doi]

The DWAN framework: Application of a web annotation framework for the general humanities to the domain of language resourcesPrzemyslaw Lenkiewicz, Olha Shkaravska, Twan Goosen, Daan Broeder, Menzo Windhouwer, Stephanie Roth, Olof Olsson. 3644-3649 [doi]

Co-Training for Classification of Live or Studio Music RecordingsNicolas Auguin, Pascale Fung. 3650-3653 [doi]

Efficient Reuse of Structured and Unstructured Resources for Ontology PopulationChetana Gavankar, Ashish Kulkarni, Ganesh Ramakrishnan. 3654-3660 [doi]

From Natural Language to Ontology Population in the Cultural Heritage Domain. A Computational Linguistics-based approachMaria Pia di Buono, Mario Monteleone. 3661-3666 [doi]

A Gold Standard for CLIR evaluation in the Organic Agriculture DomainAlessio Bosca, Matteo Casu, Mauro Dragoni, Nikolaos Marianos. 3667-3670 [doi]

VOAR: A Visual and Integrated Ontology Alignment EnvironmentBernardo Severo, Cássia Trojahn dos Santos, Renata Vieira. 3671-3677 [doi]

HiEve: A Corpus for Extracting Event Hierarchies from News StoriesGoran Glavas, Jan Snajder, Marie-Francine Moens, Parisa KordJamshidi. 3678-3683 [doi]

Building a Database of Japanese Adjective Examples from Special Purpose Web CorporaMasaya Yamaguchi. 3684-3688 [doi]

TLAXCALA: a multilingual corpus of independent newsAntonio Toral. 3689-3692 [doi]

Votter Corpus: A Corpus of Social Polling LanguageNathan Green, Septina Dian Larasati. 3693-3697 [doi]

Developing Text Resources for Ten South African LanguagesRoald Eiselen, Martin J. Puttkammer. 3698-3703 [doi]

Momresp: A Bayesian Model for Multi-Annotator Document LabelingPaul Felt, Robbie Haertel, Eric K. Ringger, Kevin D. Seppi. 3704-3711 [doi]

The Polish Summaries CorpusMaciej Ogrodniczuk, Mateusz Kopec. 3712-3715 [doi]

Evaluating Web-as-corpus Topical Document Retrieval with an Index of the OpenDirectoryClément de Groc, Xavier Tannier. 3716-3719 [doi]

Improving Open Relation Extraction via Sentence Re-StructuringJordan Schmidek, Denilson Barbosa. 3720-3723 [doi]

Semantic Search in Documents Enriched by LOD-based AnnotationsPavel Smrz, Jan Kouril. 3724-3727 [doi]

BiographyNet: Methodological Issues when NLP supports historical researchAntske Fokkens, Serge Ter Braake, Niels Ockeloen, Piek Vossen, Susan Legêne, Guus Schreiber. 3728-3735 [doi]

Using Large Biomedical Databases as Gold Annotations for Automatic Relation ExtractionTilia Ellendorff, Fabio Rinaldi, Simon Clematide. 3736-3741 [doi]

A Method for Building Burst-Annotated Co-Occurrence Networks for Analysing Trends in Textual DataYutaka Mitsuishi, Vít Novácek, Pierre-Yves Vandenbussche. 3742-3747 [doi]

Definition patterns for predicative terms in specialized lexical resourcesAntonio San Martín, Marie-Claude L'Homme. 3748-3755 [doi]

ColLex.en: Automatically Generating and Evaluating a Full-form Lexicon for EnglishTim vor der Brück, Alexander Mehler, Zahurul Islam. 3756-3760 [doi]

Enrichment of Bilingual Dictionary through News Stream DataAjay Dubey, Parth Gupta, Vasudeva Varma, Paolo Rosso. 3761-3765 [doi]

FLELex: a graded lexical resource for French foreign learnersThomas François, Nuria Gala, Patrick Watrin, Cédrick Fairon. 3766-3773 [doi]

OpenLogos Semantico-Syntactic Knowledge-Rich Bilingual DictionariesAnabela Barreiro, Fernando Batista, Ricardo Ribeiro 0001, Helena Moniz, Isabel Trancoso. 3774-3781 [doi]

Tharwa: A Large Scale Dialectal Arabic - Standard Arabic - English LexiconMona T. Diab, Mohamed Al-Badrashiny, Maryam Aminian, Mohammed Attia, Heba Elfardy, Nizar Habash, Abdelati Hawwari, Wael Salloum, Pradeep Dasigi, Ramy Eskander. 3782-3789 [doi]

Automatic Methods for the Extension of a Bilingual Dictionary using Comparable CorporaMichael Rosner, Kurt Sultana. 3790-3797 [doi]

Evaluating Lemmatization Models for Machine-Assisted Corpus-Dictionary LinkageKevin Black, Eric K. Ringger, Paul Felt, Kevin D. Seppi, Kristian Heal, Deryle Lonsdale. 3798-3805 [doi]

Linguistic resources and cats: how to use ISOcat, RELcat and SCHEMAcatMenzo Windhouwer, Ineke Schuurman. 3806-3810 [doi]

Language Processing Infrastructure in the XLike ProjectLluís Padró, Zeljko Agic, Xavier Carreras, Blaz Fortuna, Esteban García-Cuesta, Zhixing Li, Tadej Stajner, Marko Tadic. 3811-3816 [doi]

Access control by query rewriting: the case of KorAPPiotr Banski, Nils Diewald, Michael Hanl, Marc Kupietz, Andreas Witt. 3817-3822 [doi]

IXA pipeline: Efficient and Ready to Use Multilingual NLP toolsRodrigo Agerri, Josu Bermudez, German Rigau. 3823-3828 [doi]

Integration of Workflow and Pipeline for Language Service CompositionTrang Mai Xuan, Yohei Murakami, Donghui Lin, Toru Ishida. 3829-3836 [doi]

Interoperability and Customisation of Annotation Schemata in ArgoRafal Rak, Jacob Carter, Andrew Rowley, Riza Theresa Batista-Navarro, Sophia Ananiadou. 3837-3842 [doi]

Developing a Framework for Describing Relations among Language ResourcesPenny Labropoulou, Christopher Cieri, Maria Gavrilidou. 3843-3850 [doi]

Towards automatic quality assessment of component metadataThorsten Trippel, Daan Broeder, Matej Durco, Oddrun Pauline Ohren. 3851-3856 [doi]

Hope and Fear: How Opinions Influence FactualityChantal van Son, Marieke van Erp, Antske Fokkens, Piek Vossen. 3857-3864 [doi]

A Large Corpus of Product Reviews in Portuguese: Tackling Out-Of-Vocabulary WordsNathan Hartmann, Lucas Avanço, Pedro Paulo Balage Filho, Magali Sanches Duran, Maria das Graças Volpe Nunes, Thiago Pardo, Sandra M. Aluísio. 3865-3871 [doi]

Harmonization of German Lexical Resources for Opinion MiningThierry Declerck, Hans-Ulrich Krieger. 3872-3876 [doi]

Evaluation of different strategies for domain adaptation in opinion miningAnne Garcia-Fernandez, Olivier Ferret, Marco Dinarelli. 3877-3880 [doi]

Toward a unifying model for Opinion, Sentiment and Emotion information extractionAmel Fraisse, Patrick Paroubek. 3881-3886 [doi]

Exploiting the large-scale German Broadcast Corpus to boost the Fraunhofer IAIS Speech Recognition SystemMichael Stadtschnitzer, Jochen Schwenninger, Daniel Stein, Joachim Köhler. 3887-3890 [doi]

Macrosyntactic Segmenters of a French Spoken CorpusIlaine Wang, Sylvain Kahane, Isabelle Tellier. 3891-3896 [doi]

VOLIP: a corpus of spoken Italian and a virtuous example of reuse of linguistic resourcesIolanda Alfano, Francesco Cutugno, Aurelio De Rosa, Claudio Iacobini, Renata Savy, Miriam Voghera. 3897-3901 [doi]

DisMo: A Morphosyntactic, Disfluency and Multi-Word Unit Annotator. An Evaluation on a Corpus of French Spontaneous and Read SpeechGeorge Christodoulides, Mathieu Avanzi, Jean Philippe Goldman. 3902-3907 [doi]

Revising the annotation of a Broadcast News corpus: a linguistic approachVera Cabarrão, Helena Moniz, Fernando Batista, Ricardo Ribeiro 0001, Nuno J. Mamede, Hugo Meinedo, Isabel Trancoso, Ana Isabel Mata, David Martins de Matos. 3908-3913 [doi]

Teenage and adult speech in school context: building and processing a corpus of European PortugueseAna Isabel Mata, Helena Moniz, Fernando Batista, Julia Hirschberg. 3914-3919 [doi]

Croatian MemoriesArjan van Hessen, Franciska de Jong, Stef Scagliola, Tanja Petrovic. 3920-3926 [doi]

The KiezDeutsch Korpus (KiDKo) Release 1.0Ines Rehbein, Sören Schalowski, Heike Wiese. 3927-3934 [doi]

Enhancing the TED-LIUM Corpus with Selected Data for Language Modeling and More TED TalksAnthony Rousseau, Paul Deléglise, Yannick Estève. 3935-3939 [doi]

Untrained Forced Alignment of Transcriptions and Audio for Language Documentation Corpora using WebMAUSJan Strunk, Florian Schiel, Frank Seifart. 3940-3947 [doi]

Phoneme Set Design Using English Speech Database by Japanese for Dialogue-Based English CALL SystemsXiaoyun Wang, Jin-Song Zhang, Masafumi Nishida, Seiichi Yamamoto. 3948-3951 [doi]

GENERATING A LEXICON OF ERRORS IN PORTUGUESE TO SUPPORT AN ERROR IDENTIFICATION SYSTEM FOR SPANISH NATIVE LEARNERSLianet Sepúlveda Torres, Magali Sanches Duran, Sandra M. Aluísio. 3952-3957 [doi]

Automatic Error Detection concerning the Definite and Indefinite Conjugation in the HunLearner CorpusVeronika Vincze, János Zsibrita, Péter Durst, Martina Katalin Szabó. 3958-3962 [doi]

Presenting a system of human-machine interaction for performing map tasksGabriele Pallotti, Francesca Frontini, Fabio Affè, Monica Monachini, Stefania Ferrari. 3963-3966 [doi]

Assessment of Non-native Prosody for Spanish as L2 using quantitative scores and perceptual evaluationValentín Cardeñoso-Payo, César González Ferreras, David Escudero Mancebo. 3967-3972 [doi]

A flexible language learning platform based on language resources and web servicesElena Volodina, Ildikó Pilán, Lars Borin, Therese Lindström Tiedemann. 3973-3978 [doi]

MAT: a tool for L2 pronunciation errors annotationRenlong Ai, Marcela Charfuelan. 3979-3982 [doi]

Modeling Language Proficiency Using Implicit FeedbackChris Hokamp, Rada Mihalcea, Peter Schuelke. 3983-3986 [doi]

ETER : a new metric for the evaluation of hierarchical named entity recognitionMohamed Ameur Ben Jannet, Martine Adda-Decker, Olivier Galibert, Juliette Kahn, Sophie Rosset. 3987-3994 [doi]

The ETAPE speech processing evaluationOlivier Galibert, Jeremy Leixa, Gilles Adda, Khalid Choukri, Guillaume Gravier. 3995-3999 [doi]

RECSA: Resource for Evaluating Cross-lingual Semantic AnnotationAchim Rettinger, Lei Zhang 0034, Dasa Berovic, Danijela Merkler, Matea Srebacic, Marko Tadic. 4000-4003 [doi]

A Comparative Evaluation Methodology for NLG in Interactive SystemsHelen F. Hastie, Anja Belz. 4004-4011 [doi]

Terminology localization guidelines for the national scenarioJuris Borzovs, Ilze Ilzina, Iveta Keisa, Marcis Pinnis, Andrejs Vasiljevs. 4012-4017 [doi]

TermWise: A CAT-tool with Context-Sensitive Terminological SupportKris Heylen, Stephen Bond, Dirk De Hertog, Ivan Vulic, Hendrik Kockaert. 4018-4022 [doi]

Extending the coverage of a MWE database for Persian CPs exploiting valency alternationsPollet Samvelian, Pegah Faghiri, Sarra El Ayari. 4023-4026 [doi]

Evaluation of Technology Term Recognition with Random IndexingBehrang Q. Zadeh, Siegfried Handschuh. 4027-4032 [doi]

Collaboratively Annotating Multilingual Parallel Corpora in the Biomedical Domain―some MANTRAsJohannes Hellrich, Simon Clematide, Udo Hahn, Dietrich Rebholz-Schuhmann. 4033-4040 [doi]

Aggregation methods for efficient collocation detectionAnca Dinu, Liviu P. Dinu, Ionut Sorodoc. 4041-4045 [doi]

An evaluation of the role of statistical measures and frequency for MWE identificationSandra Antunes, Amália Mendes. 4046-4051 [doi]

The CMU METAL Farsi NLP ApproachWeston Feely, Mehdi Manshadi, Robert E. Frederking, Lori S. Levin. 4052-4055 [doi]

Constituency Parsing of Bulgarian: Word- vs Class-based ParsingMasood Ghayoomi, Kiril Simov, Petya Osenova. 4056-4060 [doi]

A System for Experiments with Dependency ParsersKiril Simov, Iliana Simova, Ginka Ivanova, Maria Mateva, Petya Osenova. 4061-4065 [doi]

An Out-of-Domain Test Suite for Dependency Parsing of GermanWolfgang Seeker, Jonas Kuhn. 4066-4073 [doi]

Dependency parsing representation effects on the accuracy of semantic applications ― an example of an inflective languageLauma Pretkalnina, Arturs Znotins, Laura Rituma, Didzis Gosko. 4074-4081 [doi]

Validation Issues induced by an Automatic Pre-Annotation Mechanism in the Building of Non-projective Dependency TreebanksOphélie Lacroix, Denis Béchet. 4082-4086 [doi]

Automatic Refinement of Syntactic Categories in Chinese Word StructuresJianqiang Ma. 4087-4092 [doi]

Experiences with Parallelisation of an Existing NLP Pipeline: Tagging HansardStephen Wattam, Paul Rayson, Marc Alexander, Jean Anderson. 4093-4096 [doi]

Adapting a part-of-speech tagset to non-standard text: The case of STTSHeike Zinsmeister, Ulrich Heid, Kathrin Beck. 4097-4104 [doi]

TALC-sef A Manually-Revised POS-TAgged Literary Corpus in Serbian, English and FrenchAntonio Balvet, Dejan Stosic, Aleksandra Miletic. 4105-4110 [doi]

An open source part-of-speech tagger for Norwegian: Building on existing language resourcesCristina Sánchez-Marco. 4111-4117 [doi]

Standardisation and Interoperation of Morphosyntactic and Syntactic Annotation Tools for Spanish and their AnnotationsAntonio Pareja-Lora, Guillermo Cárcamo-Escorza, Alicia Ballesteros-Calvo. 4118-4124 [doi]

Exploring and Visualizing Variation in Language ResourcesPeter Fankhauser, Jörg Knappen, Elke Teich. 4125-4128 [doi]

Introducing a web application for labeling, visualizing speech and correcting derived speech signalsRaphael Winkelmann, Georg Raess. 4129-4133 [doi]

AraNLP: a Java-based Library for the Processing of Arabic TextMaha Althobaiti, Udo Kruschwitz, Massimo Poesio. 4134-4138 [doi]

Applying Accessibility-Oriented Controlled Language (CL) Rules to Improve Appropriateness of Text Alternatives for Images: an Exploratory StudySilvia Rodríguez Vázquez, Pierrette Bouillon, Anton Bolfing. 4139-4146 [doi]

GraPAT: a Tool for Graph AnnotationsJonathan Sonntag, Manfred Stede. 4147-4151 [doi]

Discovering the Italian literature: interactive access to audio indexed text resourcesVincenzo Galatà, Alberto Benin, Piero Cosi, Giuseppe Riccardo Leone, Giulio Paci, Giacomo Sommavilla, Fabio Tesser. 4152-4156 [doi]

Creating Summarization Systems with SUMMAHoracio Saggion. 4157-4163 [doi]

TMO ― The Federated Ontology of the TrendMiner ProjectHans-Ulrich Krieger, Thierry Declerck. 4164-4171 [doi]

A Collection of Scholarly Book Reviews from the Platforms of electronic sources in Humanities and Social Sciences OpenEdition.orgChahinez Benkoussas, Hussam Hamdan, Patrice Bellot, Frédéric Béchet, Elodie Faath. 4172-4177 [doi]

A Meta-data Driven Platform for Semi-automatic Configuration of Ontology MediatorsManuel Fiorelli, Maria Teresa Pazienza, Armando Stellato. 4178-4183 [doi]

Twente Debate Corpus ― A Multimodal Corpus for Head Movement AnalysisBayu Rahayudi, Ronald Poppe, Dirk Heylen. 4184-4188 [doi]

A Multimodal Corpus of Rapid Dialogue GamesMaike Paetzel, David Nicolas Racca, David DeVault. 4189-4195 [doi]

The Tutorbot Corpus ― A Corpus for Studying Tutoring Behaviour in Multiparty Face-to-Face Spoken DialogueMaria Koutsombogera, Samer Al Moubayed, Bajibabu Bollepalli, Ahmed Hussen Abdelaziz, Martin Johansson, José David Águas Lopes, Jekaterina Novikova, Catharine Oertel, Kalin Stefanov, Gül Varol. 4196-4201 [doi]

Exploiting Portuguese Lexical Knowledge Bases for Answering Open Domain Cloze Questions AutomaticallyHugo Gonçalo Oliveira, Inês Coelho, Paulo Gomes. 4202-4209 [doi]

Single Classifier Approach for Verb Sense Disambiguation based on Generalized FeaturesDaisuke Kawahara, Martha Palmer. 4210-4213 [doi]

Annotating the MASC Corpus with BabelNetAndrea Moro 0001, Roberto Navigli, Francesco Maria Tucci, Rebecca J. Passonneau. 4214-4219 [doi]

The liability of service providers in e-Research Infrastructures: killing the messenger?Pawel Kamocki. 4220-4224 [doi]

Evaluating corpora documentation with regards to the Ethics and Big Data CharterAlain Couillault, Karën Fort, Gilles Adda, Hugues de Mazancourt. 4225-4229 [doi]

Disclose Models, Hide the Data - How to Make Use of Confidential Corpora without Seeing Sensitive Raw DataErik Faessler, Johannes Hellrich, Udo Hahn. 4230-4237 [doi]

Who cares about Sarcastic Tweets? Investigating the Impact of Sarcasm on Sentiment AnalysisDiana Maynard, Mark A. Greenwood. 4238-4243 [doi]

SenTube: A Corpus for Sentiment Analysis on YouTube Social MediaOlga Uryupina, Barbara Plank, Aliaksei Severyn, Agata Rotondi, Alessandro Moschitti. 4244-4249 [doi]

Getting Reliable Annotations for Sarcasm in Online DialoguesReid Swanson, Stephanie M. Lukin, Luke Eisenberg, Thomas Corcoran, Marilyn A. Walker. 4250-4257 [doi]

Modelling Irony in Twitter: Feature Analysis and EvaluationFrancesco Barbieri, Horacio Saggion. 4258-4264 [doi]

Resource Creation and Evaluation for Multilingual Sentiment Analysis in Social Media TextsAlexandra Balahur, Marco Turchi, Ralf Steinberger, Jose Manuel Perea Ortega, Guillaume Jacquet, Dilek Küçük, Vanni Zavarella, Adil El Ghali. 4265-4269 [doi]

Semantic Clustering of Pivot ParaphrasesMarianna Apidianaki, Emilia Verzeni, Diana McCarthy. 4270-4275 [doi]

The Multilingual Paraphrase DatabaseJuri Ganitkevitch, Chris Callison-Burch. 4276-4283 [doi]

Multiple Choice Question Corpus Analysis for Distractor CharacterizationVan-Minh Pho, Thibault André, Anne-Laure Ligozat, Brigitte Grau, Gabriel Illouz, Thomas François. 4284-4291 [doi]

Creating and using large monolingual parallel corpora for sentential paraphrase generationSander Wubben, Antal van den Bosch, Emiel Krahmer. 4292-4299 [doi]

Aligning Predicate-Argument Structures for Paraphrase Fragment ExtractionMichaela Regneri, Rui Wang, Manfred Pinkal. 4300-4307 [doi]

Combining dependency information and generalization in a pattern-based approach to the classification of lexical-semantic relation instancesSilvia Necsulescu, Sara Mendes, Núria Bel. 4308-4315 [doi]

Corpus and Method for Identifying Citations in Non-Academic TextYifan He, Adam Meyers. 4316-4319 [doi]

Language Resources and Annotation Tools for Cross-Sentence Relation ExtractionSebastian Krause, Hong Li, Feiyu Xu, Hans Uszkoreit, Robert Hummel, Luise Spielhagen. 4320-4325 [doi]

Creative language explorations through a high-expressivity N-grams query languageCarlo Strapparava, Lorenzo Gatti, Marco Guerini, Oliviero Stock. 4326-4330 [doi]

Semantic Technologies for Querying Linguistic Annotations: An Experiment Focusing on Graph-Structured DataMilen Kouylekov, Stephan Oepen. 4331-4336 [doi]

From Non Word to New Word: Automatically Identifying Neologisms in French NewspapersIngrid Falk, Delphine Bernhard, Christophe Gérard. 4337-4344 [doi]

How to construct a multi-lingual domain ontologyNitsan Chrizman, Alon Itai. 4345-4350 [doi]

Ruled-based, Interlingual Motivated Mapping of plWordNet onto SUMO OntologyPawel Kedzia, Maciej Piasecki. 4351-4358 [doi]

Augmenting English Adjective Senses with SupersensesYulia Tsvetkov, Nathan Schneider, Dirk Hovy, Archna Bhatia, Manaal Faruqui, Chris Dyer. 4359-4365 [doi]

Choosing which to use? A study of distributional models for nominal lexical semantic classificationLauren Romeo, Gianluca Lebani, Núria Bel, Alessandro Lenci. 4366-4373 [doi]

On the annotation of TMX translation memories for advanced leveraging in computer-aided translationMikel L. Forcada. 4374-4378 [doi]

Manual Analysis of Structurally Informed Reordering in German-English Machine TranslationTeresa Herrmann, Jan Niehues, Alex Waibel. 4379-4386 [doi]

Conceptual transfer: Using local classifiers for transfer selectionGregor Thurmair. 4387-4393 [doi]

Sharing resources between free/open-source rule-based machine translation systems: Grammatical Framework and ApertiumGrégoire Détrez, Víctor M. Sánchez-Cartagena, Aarne Ranta. 4394-4400 [doi]

Missed opportunities in translation memory matchingFriedel Wolff, Laurette Pretorius, Paul Buitelaar. 4401-4406 [doi]

Interoperability of Dialogue Corpora through ISO 24617-2-based QueryingVolha Petukhova, Andrei Malchanau, Harry Bunt. 4407-4414 [doi]

Comparative analysis of verbal alignment in human-human and human-agent interactionsSabrina Campano, Jessica Durand, Chloé Clavel. 4415-4422 [doi]

Free English and Czech telephone speech corpus shared under the CC-BY-SA 3.0 licenseMatej Korvas, Ondrej Plátek, Ondrej Dusek, Lukás Zilka, Filip Jurcícek. 4423-4428 [doi]

Japanese conversation corpus for training and evaluation of backchannel prediction modelHiroaki Noguchi, Yasuhiro Katagiri, Yasuharu Den. 4429-4433 [doi]

DiVE-Arabic: Gulf Arabic Dialogue in a Virtual EnvironmentAndrew Gargett, Sam Hellmuth, Ghazi AlGethami. 4434-4439 [doi]

Evaluation of Simple Distributional Compositional Operations on Longer TextsTamara Polajnar, Laura Rimell, Stephen Clark. 4440-4443 [doi]

A Character-based Approach to Distributional Semantic Models: Exploiting Kanji Characters for Constructing JapaneseWord VectorsAkira Utsumi. 4444-4450 [doi]

A cascade approach for complex-type classificationLauren Romeo, Sara Mendes, Núria Bel. 4451-4458 [doi]

A Rank-based Distance Measure to Detect Polysemy and to Determine Salient Vector-Space Features for German PrepositionsMaximilian Köper, Sabine Schulte im Walde. 4459-4466 [doi]

Focusing Annotation for Semantic Role LabelingDaniel Peterson, Martha Palmer, Shumin Wu. 4467-4471 [doi]

When POS data sets don't add up: Combatting sample biasDirk Hovy, Barbara Plank, Anders Søgaard. 4472-4475 [doi]

Using C5.0 and Exhaustive Search for Boosting Frame-Semantic Parsing AccuracyGuntis Barzdins, Didzis Gosko, Laura Rituma, Peteris Paikens. 4476-4482 [doi]

ML-Optimization of Ported Constraint GrammarsEckhard Bick. 4483-4487 [doi]

A Deep Context Grammatical Model For Authorship AttributionSimon Fuller, Phil Maguire, Philippe Moser. 4488-4492 [doi]

Mapping Between English Strings and Reentrant Semantic GraphsFabienne Braune, Daniel Bauer, Kevin Knight. 4493-4498 [doi]

The Sweet-Home speech and multimodal corpus for home automation interactionMichel Vacher, Benjamin Lecouteux, Pedro Chahuara, François Portet, Brigitte Meillon, Nicolas Bonnefond. 4499-4506 [doi]

Multimodal Corpora for Silent Speech InteractionJoão Freitas, António J. S. Teixeira, Miguel Sales Dias. 4507-4511 [doi]

3D Face Tracking and Multi-Scale, Spatio-temporal Analysis of Linguistically Significant Facial Expressions and Head Positions in ASLBo Liu, Jingjing Liu, Xiang Yu, Dimitris N. Metaxas, Carol Neidle. 4512-4518 [doi]

HuRIC: a Human Robot Interaction CorpusEmanuele Bastianelli, Giuseppe Castellucci, Danilo Croce, Luca Iocchi, Roberto Basili, Daniele Nardi. 4519-4526 [doi]

Event Extraction Using Distant SupervisionKevin Reschke, Martin Jankowiak, Mihai Surdeanu, Christopher D. Manning, Daniel Jurafsky. 4527-4531 [doi]

SinoCoreferencer: An End-to-End Chinese Event Coreference ResolverChen Chen, Vincent Ng. 4532-4538 [doi]

Supervised Within-Document Event Coreference using Information PropagationZhengzhong Liu, Jun Araki, Eduard H. Hovy, Teruko Mitamura. 4539-4544 [doi]

Using a sledgehammer to crack a nut? Lexical diversity and event coreference resolutionAgata Cybulska, Piek Vossen. 4545-4552 [doi]

Detecting Subevent Structure for Event Coreference ResolutionJun Araki, Zhengzhong Liu, Eduard H. Hovy, Teruko Mitamura. 4553-4558 [doi]

Three dimensions of the so-called ""interoperability"" of annotation schemes"Eva Hajicová. 4559-4564 [doi]

Experiences with the ISOcat Data Category RegistryDaan Broeder, Ineke Schuurman, Menzo Windhouwer. 4565-4568 [doi]

Towards interoperable discourse annotation. Discourse features in the Ontologies of Linguistic AnnotationChristian Chiarcos. 4569-4577 [doi]

Off-Road LAF: Encoding and Processing Annotations in NLP WorkflowsEmanuele Lapponi, Erik Velldal, Stephan Oepen, Rune Lain Knudsen. 4578-4584 [doi]

Universal Stanford dependencies: A cross-linguistic typologyMarie-Catherine de Marneffe, Timothy Dozat, Natalia Silveira, Katri Haverinen, Filip Ginter, Joakim Nivre, Christopher D. Manning. 4585-4592 [doi]

Benchmarking the Extraction and Disambiguation of Named Entities on the Semantic WebGiuseppe Rizzo 0002, Marieke van Erp, Raphaël Troncy. 4593-4600 [doi]

Annotating Relations in Scientific ArticlesAdam Meyers, Giancarlo Lee, Angus Grieve-Smith, Yifan He, Harriet Taber. 4601-4608 [doi]

Improving Entity Linking using Surface Form RefinementEric Charton, Marie-Jean Meurs, Ludovic Jean-Louis, Michel Gagnon. 4609-4615 [doi]

Evaluating Improvised Hip Hop Lyrics - Challenges and ObservationsKarteek Addanki, Dekai Wu. 4616-4623 [doi]

Towards Automatic Detection of Narrative StructureJessica Ouyang, Kathy McKeown. 4624-4631 [doi]

External Links

Cite Key

Statistics

PDF

Researchr

Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC-2014), Reykjavik, Iceland, May 26-31, 2014

Abstract

Table of Contents