Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing, ACL/IJCNLP 2021, (Volume 1: Long Papers), Virtual Event, August 1-6, 2021 - researchr publication

researchr

You are not signed in
Sign in
Sign up

Chengqing Zong, Fei Xia, Wenjie Li 0002, Roberto Navigli, editors, Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing, ACL/IJCNLP 2021, (Volume 1: Long Papers), Virtual Event, August 1-6, 2021. Association for Computational Linguistics, 2021. [doi]

Conference: acl2021

Abstract is missing.

Frontmatter [doi]

Investigating label suggestions for opinion mining in German Covid-19 social mediaTilman Beck, Ji Ung Lee, Christina Viehmann, Marcus Maurer, Oliver Quiring, Iryna Gurevych. 1-13 [doi]

How Did This Get Funded?! Automatically Identifying Quirky Scientific AchievementsChen Shani, Nadav Borenstein, Dafna Shahaf. 14-28 [doi]

Engage the Public: Poll Question Generation for Social Media PostsZexin Lu, Keyang Ding, Yuji Zhang, Jing Li, Baolin Peng, Lemao Liu. 29-40 [doi]

HateCheck: Functional Tests for Hate Speech Detection ModelsPaul Röttger, Bertie Vidgen, Dong Nguyen 0002, Zeerak Waseem, Helen Z. Margetts, Janet B. Pierrehumbert. 41-58 [doi]

Unified Dual-view Cognitive Model for Interpretable Claim VerificationLianwei Wu, Yuan Rao, Yuqian Lan, Ling Sun 0004, Zhaoyin Qi. 59-68 [doi]

DeepRapper: Neural Rap Generation with Rhyme and Rhythm ModelingLanqing Xue, Kaitao Song, Duocai Wu, Xu Tan 0003, Nevin L. Zhang, Tao Qin, Wei-Qiang Zhang, Tie-Yan Liu. 69-81 [doi]

PENS: A Dataset and Generic Framework for Personalized News Headline GenerationXiang Ao, Xiting Wang, Ling Luo, Ying Qiao, Qing He 0003, Xing Xie 0001. 82-92 [doi]

Enhancing Content Preservation in Text Style Transfer Using Reverse Attention and Conditional Layer NormalizationDongkyu Lee, Zhiliang Tian, Lanqing Xue, Nevin L. Zhang. 93-102 [doi]

Mention Flags (MF): Constraining Transformer-based Text GeneratorsYufei Wang 0003, Ian D. Wood, Stephen Wan 0001, Mark Dras, Mark Johnson 0001. 103-113 [doi]

Generalising Multilingual Concept-to-Text NLG with Language Agnostic DelexicalisationGiulio Zhou, Gerasimos Lampouras. 114-127 [doi]

Conversations Are Not Flat: Modeling the Dynamic Information Flow across Dialogue UtterancesZekang Li, Jinchao Zhang, Zhengcong Fei, Yang Feng 0004, Jie Zhou 0016. 128-138 [doi]

Dual Slot Selector via Local Reliability Verification for Dialogue State TrackingJinyu Guo, Kai Shuang, Jijie Li, Zihan Wang. 139-151 [doi]

Transferable Dialogue Systems and User SimulatorsBo-Hsiang Tseng, Yinpei Dai, Florian Kreyssig, Bill Byrne. 152-166 [doi]

BoB: BERT Over BERT for Training Persona-based Dialogue Models from Limited Personalized DataHaoyu Song 0002, Yan Wang 0060, Kaiyan Zhang, Wei-Nan Zhang 0003, Ting Liu 0001. 167-177 [doi]

GL-GIN: Fast and Accurate Non-Autoregressive Model for Joint Multiple Intent Detection and Slot FillingLibo Qin, Fuxuan Wei, Tianbao Xie, Xiao Xu, Wanxiang Che, Ting Liu 0001. 178-188 [doi]

Accelerating BERT Inference for Sequence Labeling via Early-ExitXiaonan Li, Yunfan Shao, Tianxiang Sun, Hang Yan, Xipeng Qiu, Xuanjing Huang. 189-199 [doi]

Modularized Interaction Network for Named Entity RecognitionFei Li, Zheng Wang, Siu Cheung Hui, Lejian Liao, Dandan Song, Jing Xu, Guoxiu He, Meihuizi Jia. 200-209 [doi]

Capturing Event Argument Interaction via A Bi-Directional Entity-Level Recurrent DecoderXiangyu Xi, Wei Ye 0004, Shikun Zhang, Quanxiu Wang, Huixing Jiang, Wei Wu. 210-219 [doi]

UniRE: A Unified Label Space for Entity Relation ExtractionYijun Wang, Changzhi Sun, Yuanbin Wu, Hao Zhou 0012, Lei Li 0005, Junchi Yan. 220-231 [doi]

Refining Sample Embeddings with Relation Prototypes to Enhance Continual Relation ExtractionLi Cui, Deqing Yang, Jiaxin Yu, Chengwei Hu, Jiayang Cheng, Jingjie Yi, Yanghua Xiao. 232-243 [doi]

Contrastive Learning for Many-to-many Multilingual Neural Machine TranslationXiao Pan, Mingxuan Wang, Liwei Wu, Lei Li. 244-258 [doi]

Understanding the Properties of Minimum Bayes Risk Decoding in Neural Machine TranslationMathias Müller 0002, Rico Sennrich. 259-272 [doi]

Multi-Head Highly Parallelized LSTM Decoder for Neural Machine TranslationHongfei Xu, Qiuhui Liu, Josef van Genabith, Deyi Xiong, Meng Zhang. 273-282 [doi]

A Bidirectional Transformer Based Alignment Model for Unsupervised Word AlignmentJingyi Zhang, Josef van Genabith. 283-292 [doi]

Learning Language Specific Sub-network for Multilingual Machine TranslationZehui Lin, Liwei Wu, Mingxuan Wang, Lei Li. 293-305 [doi]

Exploring the Efficacy of Automatically Generated Counterfactuals for Sentiment AnalysisLinyi Yang, Jiazheng Li 0002, Padraig Cunningham, Yue Zhang, Barry Smyth, Ruihai Dong. 306-316 [doi]

Bridge-Based Active Domain Adaptation for Aspect Term ExtractionZhuang Chen 0002, Tieyun Qian. 317-327 [doi]

Multimodal Sentiment Detection Based on Multi-channel Graph Neural NetworksXiaocui Yang, Shi Feng, Yifei Zhang 0003, Daling Wang. 328-339 [doi]

Aspect-Category-Opinion-Sentiment Quadruple Extraction with Implicit Aspects and OpinionsHongjie Cai, Rui Xia, Jianfei Yu. 340-350 [doi]

PASS: Perturb-and-Select Summarizer for Product ReviewsNadav Oved, Ran Levy. 351-365 [doi]

Deep Differential Amplifier for Extractive SummarizationRuipeng Jia, Yanan Cao, Fang Fang, Yuchen Zhou, Zheng Fang 0002, Yanbing Liu, Shi Wang. 366-376 [doi]

Multi-TimeLine Summarization (MTLS): Improving Timeline Summarization by Generating Multiple SummariesYi Yu, Adam Jatowt, Antoine Doucet, Kazunari Sugiyama, Masatoshi Yoshikawa. 377-387 [doi]

Self-Supervised Multimodal Opinion SummarizationJinbae Im, Moonki Kim, Hoyeop Lee, Hyunsouk Cho, Sehee Chung. 388-403 [doi]

A Training-free and Reference-free Summarization Evaluation Metric via Centrality-weighted Relevance and Self-referenced RedundancyWang Chen, Piji Li, Irwin King. 404-414 [doi]

DESCGEN: A Distantly Supervised Datasetfor Generating Entity DescriptionsWeijia Shi, Mandar Joshi, Luke Zettlemoyer. 415-427 [doi]

Introducing Orthogonal Constraint in Structural ProbesTomasz Limisiewicz, David Marecek. 428-442 [doi]

Hidden Killer: Invisible Textual Backdoor Attacks with Syntactic TriggerFanchao Qi, Mukai Li, Yangyi Chen, Zhengyan Zhang, Zhiyuan Liu 0001, Yasheng Wang, Maosong Sun. 443-453 [doi]

Examining the Inductive Bias of Neural Language Models with Artificial LanguagesJennifer C. White, Ryan Cotterell. 454-463 [doi]

Explaining Contextualization in Language Models using Visual AnalyticsRita Sevastjanova, Aikaterini-Lida Kalouli, Christin Beck, Hanna Schäfer, Mennatallah El-Assady. 464-476 [doi]

Improving the Faithfulness of Attention-based Explanations with Task-specific Information for Text ClassificationGeorge Chrysostomou, Nikolaos Aletras. 477-488 [doi]

Generating Landmark Navigation Instructions from Maps as a Graph-to-Text ProblemRaphael Schumann, Stefan Riezler. 489-502 [doi]

E2E-VLP: End-to-End Vision-Language Pre-training Enhanced by Visual LearningHaiyang Xu, Ming Yan, Chenliang Li, Bin Bi, Songfang Huang, Wenming Xiao, Fei Huang. 503-513 [doi]

Learning Relation Alignment for Calibrated Cross-modal RetrievalShuhuai Ren, Junyang Lin, Guangxiang Zhao, Rui Men, an Yang, Jingren Zhou, Xu Sun 0001, Hongxia Yang. 514-524 [doi]

KM-BART: Knowledge Enhanced Multimodal BART for Visual Commonsense GenerationYiran Xing, Zai Shi, Zhao Meng, Gerhard Lakemeyer, Yunpu Ma, Roger Wattenhofer. 525-535 [doi]

Cascaded Head-colliding AttentionLin Zheng, Zhiyong Wu 0003, Lingpeng Kong. 536-549 [doi]

Structural Knowledge Distillation: Tractably Distilling Information for Structured PredictorXinyu Wang 0013, Yong Jiang, Zhaohui Yan, Zixia Jia, Nguyen Bach, Tao Wang 0056, Zhongqiang Huang, Fei Huang, Kewei Tu. 550-564 [doi]

Parameter-efficient Multi-task Fine-tuning for Transformers via Shared HypernetworksRabeeh Karimi Mahabadi, Sebastian Ruder, Mostafa Dehghani 0001, James Henderson. 565-576 [doi]

COSY: COunterfactual SYntax for Cross-Lingual UnderstandingSicheng Yu, Hao Zhang, Yulei Niu, Qianru Sun, Jing Jiang 0001. 577-589 [doi]

OoMMix: Out-of-manifold Regularization in Contextual Embedding Space for Text ClassificationSeonghyeon Lee, Dongha Lee, Hwanjo Yu. 590-599 [doi]

Understanding and Countering Stereotypes: A Computational Approach to the Stereotype Content ModelKathleen C. Fraser, Isar Nejadgholi, Svetlana Kiritchenko. 600-616 [doi]

Structurizing Misinformation Stories via Rationalizing Fact-ChecksShan Jiang 0008, Christo Wilson. 617-631 [doi]

Modeling Language Usage and Listener Engagement in PodcastsSravana Reddy, Mariya Lazarova, Yongze Yu, Rosie Jones. 632-643 [doi]

Breaking Down the Invisible Wall of Informal Fallacies in Online DiscussionsSaumya Sahai, Oana Balalau, Roxana Horincar. 644-657 [doi]

SocAoG: Incremental Graph Parsing for Social Relation Inference in DialoguesLiang Qiu, Yuan Liang, Yizhou Zhao, Pan Lu, Baolin Peng, Zhou Yu, Ying Nian Wu, Song Chun Zhu. 658-670 [doi]

TicketTalk: Toward human-level performance with end-to-end, transaction-based dialog systemsBill Byrne, Karthik Krishnamoorthi, Saravanan Ganesh, Mihir Sanjay Kale. 671-680 [doi]

Improving Dialog Systems for Negotiation with Personality ModelingRunzhe Yang, Jingxiao Chen, Karthik Narasimhan. 681-693 [doi]

Learning from Perturbations: Diverse and Informative Dialogue Generation with Inverse Adversarial TrainingWangchunshu Zhou, Qifei Li, Chenle Li. 694-703 [doi]

Increasing Faithfulness in Knowledge-Grounded Dialogue with Controllable FeaturesHannah Rashkin, David Reitter, Gaurav Singh Tomar, Dipanjan Das 0001. 704-718 [doi]

CitationIE: Leveraging the Citation Graph for Scientific Information ExtractionVijay Viswanathan, Graham Neubig, Pengfei Liu 0003. 719-731 [doi]

From Discourse to Narrative: Knowledge Projection for Event Relation ExtractionJialong Tang, Hongyu Lin, Meng Liao, Yaojie Lu 0001, Xianpei Han, Le Sun 0001, Weijian Xie, Jin Xu. 732-742 [doi]

AdvPicker: Effectively Leveraging Unlabeled Data via Adversarial Discriminator for Cross-Lingual NERWeile Chen, Huiqiang Jiang, Qianhui Wu, Börje Karlsson 0001, Yi Guan. 743-753 [doi]

Compare to The Knowledge: Graph Neural Fake News Detection with External KnowledgeLinmei Hu, Tianchi Yang, Luhao Zhang, Wanjun Zhong, Duyu Tang, Chuan Shi, Nan Duan, Ming Zhou 0001. 754-763 [doi]

Discontinuous Named Entity Recognition as Maximal Clique DiscoveryYucheng Wang, Bowen Yu 0002, Hongsong Zhu, Tingwen Liu, Nan Yu, Limin Sun. 764-774 [doi]

LNN-EL: A Neuro-Symbolic Approach to Short-text Entity LinkingHang Jiang, Sairam Gurajada, Qiuhao Lu, Sumit Neelam, Lucian Popa 0001, Prithviraj Sen, Yunyao Li 0001, Alexander G. Gray. 775-787 [doi]

Do Context-Aware Translation Models Pay the Right Attention?Kayo Yin, Patrick Fernandes, Danish Pruthi, Aditi Chaudhary, André F. T. Martins, Graham Neubig. 788-801 [doi]

Adapting High-resource NMT Models to Translate Low-resource Related Languages without Parallel DataWei-Jen Ko, Ahmed El-Kishky, Adithya Renduchintala, Vishrav Chaudhary, Naman Goyal, Francisco Guzmán, Pascale Fung, Philipp Koehn, Mona T. Diab. 802-812 [doi]

Bilingual Lexicon Induction via Unsupervised Bitext Construction and Word AlignmentHaoyue Shi, Luke Zettlemoyer, Sida I. Wang. 813-826 [doi]

Multilingual Speech Translation from Efficient Finetuning of Pretrained ModelsXian Li, Changhan Wang, Yun Tang, Chau Tran, Yuqing Tang, Juan Pino, Alexei Baevski, Alexis Conneau, Michael Auli. 827-838 [doi]

Learning Faithful Representations of Causal GraphsAnanth Balashankar, Lakshminarayanan Subramanian. 839-850 [doi]

What Context Features Can Transformer Language Models Use?Joe O'Connor, Jacob Andreas. 851-864 [doi]

Integrated Directional Gradients: Feature Interaction Attribution for Neural NLP ModelsSandipan Sikdar, Parantapa Bhattacharya, Kieran Heese. 865-878 [doi]

DeCLUTR: Deep Contrastive Learning for Unsupervised Textual RepresentationsJohn M. Giorgi, Osvald Nitski, Bo Wang, Gary D. Bader. 879-895 [doi]

XLPT-AMR: Cross-Lingual Pre-Training via Multi-Task Learning for Zero-Shot AMR Parsing and Text GenerationDongqin Xu, Junhui Li, Muhua Zhu, Min Zhang, Guodong Zhou. 896-907 [doi]

Span-based Semantic Parsing for Compositional GeneralizationJonathan Herzig, Jonathan Berant. 908-921 [doi]

Compositional Generalization and Natural Language Variation: Can a Semantic Parsing Approach Handle Both?Peter Shaw, Ming-Wei Chang, Panupong Pasupat, Kristina Toutanova. 922-938 [doi]

A Targeted Assessment of Incremental Processing in Neural Language Models and HumansEthan Wilcox, Pranali Vani, Roger Levy. 939-952 [doi]

The Possible, the Plausible, and the Desirable: Event-Based Modality Detection for Language ProcessingValentina Pyatkin, Shoval Sadde, Aynat Rubinstein, Paul Portner, Reut Tsarfaty. 953-965 [doi]

To POS Tag or Not to POS Tag: The Impact of POS Tags on Morphological Learning in Low-Resource SettingsSarah Moeller, Ling Liu, Mans Hulden. 966-978 [doi]

Prosodic segmentation for parsing spoken dialogueElizabeth Nielsen, Mark Steedman, Sharon Goldwater. 979-992 [doi]

VoxPopuli: A Large-Scale Multilingual Speech Corpus for Representation Learning, Semi-Supervised Learning and InterpretationChanghan Wang, Morgane Rivière, Ann Lee, Anne Wu, Chaitanya Talnikar, Daniel Haziza, Mary Williamson, Juan Pino, Emmanuel Dupoux. 993-1003 [doi]

Stereotyping Norwegian Salmon: An Inventory of Pitfalls in Fairness Benchmark DatasetsSu Lin Blodgett, Gilsinia Lopez, Alexandra Olteanu, Robert Sim, Hanna M. Wallach. 1004-1015 [doi]

Robust Knowledge Graph Completion with Stacked Convolutions and a Student Re-Ranking NetworkJustin Lovelace, Denis Newman-Griffis, Shikhar Vashishth, Jill Fain Lehman, Carolyn P. Rosé. 1016-1029 [doi]

A DQN-based Approach to Finding Precise Evidences for Fact VerificationHai Wan, Haicheng Chen, Jianfeng Du, Weilin Luo, Rongzhen Ye. 1030-1039 [doi]

The Art of Abstention: Selective Prediction and Error Regularization for Natural Language ProcessingJi Xin, Raphael Tang, Yaoliang Yu, Jimmy Lin. 1040-1051 [doi]

Unsupervised Out-of-Domain Detection via Pre-trained TransformersKeyang Xu, Tongzheng Ren, Shikun Zhang, Yihao Feng, Caiming Xiong. 1052-1061 [doi]

MATE-KD: Masked Adversarial TExt, a Companion to Knowledge DistillationAhmad Rashid, Vasileios Lioutas, Mehdi Rezagholizadeh. 1062-1071 [doi]

Selecting Informative Contexts Improves Language Model Fine-tuningRichard Antonello, Nicole Beckage, Javier Turek, Alexander Huth. 1072-1085 [doi]

Explainable Prediction of Text Complexity: The Missing Preliminaries for Text SimplificationCristina Garbacea, Mengtian Guo, Samuel Carton, Qiaozhu Mei. 1086-1097 [doi]

Multi-Task Retrieval for Knowledge-Intensive TasksJean Maillard, Vladimir Karpukhin, Fabio Petroni, Wen-tau Yih, Barlas Oguz, Veselin Stoyanov, Gargi Ghosh. 1098-1111 [doi]

When Do You Need Billions of Words of Pretraining Data?Yian Zhang, Alex Warstadt, Xiaocheng Li, Samuel R. Bowman. 1112-1125 [doi]

Analyzing the Source and Target Contributions to Predictions in Neural Machine TranslationElena Voita, Rico Sennrich, Ivan Titov. 1126-1140 [doi]

Comparing Test Sets with Item Response TheoryClara Vania, Phu Mon Htut, William Huang, Dhara A. Mungra, Richard Yuanzhe Pang, Jason Phang, Haokun Liu, KyungHyun Cho, Samuel R. Bowman. 1141-1158 [doi]

Uncovering Constraint-Based Behavior in Neural Models via Targeted Fine-TuningForrest Davis, Marten Van Schijndel. 1159-1171 [doi]

More Identifiable yet Equally Performant Transformers for Text ClassificationRishabh Bhardwaj, Navonil Majumder, Soujanya Poria, Eduard H. Hovy. 1172-1182 [doi]

AugNLG: Few-shot Natural Language Generation using Self-trained Data AugmentationXinnuo Xu, Guoyin Wang, Young-Bum Kim, Sungjin Lee. 1183-1195 [doi]

Can vectors read minds better than experts? Comparing data augmentation strategies for the automated scoring of children's mindreading abilityVenelin Kovatchev, Phillip Smith, Mark G. Lee, Rory T. Devine. 1196-1206 [doi]

A Dataset and Baselines for Multilingual Reply SuggestionMozhi Zhang, Wei Wang 0238, Budhaditya Deb, Guoqing Zheng, Milad Shokouhi, Ahmed Hassan Awadallah. 1207-1220 [doi]

What Ingredients Make for an Effective Crowdsourcing Protocol for Difficult NLU Data Collection Tasks?Nikita Nangia, Saku Sugawara, Harsh Trivedi, Alex Warstadt, Clara Vania, Samuel R. Bowman. 1221-1235 [doi]

Align Voting Behavior with Public Statements for Legislator Representation LearningXinyi Mou, Zhongyu Wei, Lei Chen, Shangyi Ning, Yancheng He, Changjian Jiang, Xuanjing Huang. 1236-1246 [doi]

Measure and Evaluation of Semantic Divergence across Two LanguagesSyrielle Montariol, Alexandre Allauzen. 1247-1258 [doi]

Improving Zero-Shot Translation by Disentangling Positional InformationDanni Liu, Jan Niehues, James Cross, Francisco Guzmán, Xian Li. 1259-1273 [doi]

Common Sense Beyond English: Evaluating and Improving Multilingual Language Models for Commonsense ReasoningBill Yuchen Lin, Seyeon Lee, Xiaoyang Qiao, Xiang Ren 0001. 1274-1287 [doi]

Attention Calibration for Transformer in Neural Machine TranslationYu Lu, Jiali Zeng, Jiajun Zhang, Shuangzhi Wu, Mu Li 0001. 1288-1298 [doi]

Diverse Pretrained Context Encodings Improve Document TranslationDomenic Donato, Lei Yu, Chris Dyer. 1299-1311 [doi]

Exploiting Language Relatedness for Low Web-Resource Language Model Adaptation: An Indic Languages StudyYash Khemchandani, Sarvesh Mehtani, Vaidehi Patil, Abhijeet Awasthi, Partha Talukdar, Sunita Sarawagi. 1312-1323 [doi]

On Finding the K-best Non-projective Dependency TreesRan Zmigrod, Tim Vieira, Ryan Cotterell. 1324-1337 [doi]

Towards Argument Mining for Social Good: A SurveyEva Maria Vecchi, Neele Falk, Iman Jundi, Gabriella Lapesa. 1338-1352 [doi]

Automated Generation of Storytelling Vocabulary from Photographs for use in AACMaurício Fontana de Vargas, Karyn Moffatt. 1353-1364 [doi]

CLIP: A Dataset for Extracting Action Items for Physicians from Hospital Discharge NotesJames Mullenbach, Yada Pruksachatkun, Sean Adler, Jennifer Seale, Jordan Swartz, T. Greg McKelvey, Hui Dai, Yi Yang, David A. Sontag. 1365-1378 [doi]

Assessing Emoji Use in Modern Text Processing ToolsAbu Awal Md Shoeb, Gerard de Melo. 1379-1388 [doi]

Select, Extract and Generate: Neural Keyphrase Generation with Layer-wise Coverage AttentionWasi Uddin Ahmad, Xiao Bai 0002, Soomin Lee, Kai-Wei Chang. 1389-1404 [doi]

Factorising Meaning and Form for Intent-Preserving ParaphrasingTom Hosking, Mirella Lapata. 1405-1418 [doi]

AggGen: Ordering and Aggregating while GeneratingXinnuo Xu, Ondrej Dusek, Verena Rieser, Ioannis Konstas. 1419-1434 [doi]

Reflective Decoding: Beyond Unidirectional Generation with Off-the-Shelf Language ModelsPeter West, Ximing Lu, Ari Holtzman, Chandra Bhagavatula, Jena D. Hwang, Yejin Choi. 1435-1450 [doi]

Towards Table-to-Text Generation with Numerical ReasoningLya Hulliyyatus Suadaa, Hidetaka Kamigaito, Kotaro Funakoshi, Manabu Okumura, Hiroya Takamura. 1451-1465 [doi]

BACO: A Background Knowledge- and Content-Based Framework for Citing Sentence GenerationYubin Ge, Ly Dinh, Xiaofeng Liu, Jinsong Su, Ziyao Lu, Ante Wang, Jana Diesner. 1466-1478 [doi]

Language Model as an Annotator: Exploring DialoGPT for Dialogue SummarizationXiachong Feng, Xiaocheng Feng, Libo Qin, Bing Qin 0001, Ting Liu 0001. 1479-1491 [doi]

Challenges in Information-Seeking QA: Unanswerable Questions and Paragraph RetrievalAkari Asai, Eunsol Choi. 1492-1504 [doi]

A Gradually Soft Multi-Task and Data-Augmented Approach to Medical Question UnderstandingKhalil Mrini, Franck Dernoncourt, Seunghyun Yoon 0002, Trung Bui, Walter Chang, Emilia Farcas, Ndapa Nakashole. 1505-1515 [doi]

Leveraging Type Descriptions for Zero-shot Named Entity Recognition and ClassificationRami Aly, Andreas Vlachos 0001, Ryan Mcdonald. 1516-1528 [doi]

MECT: Multi-Metadata Embedding based Cross-Transformer for Chinese Named Entity RecognitionShuang Wu, Xiaoning Song, Zhen-Hua Feng. 1529-1539 [doi]

Factuality Assessment as Modal Dependency ParsingJiarui Yao, Haoling Qiu, Jin Zhao, Bonan Min, Nianwen Xue. 1540-1550 [doi]

Directed Acyclic Graph Network for Conversational Emotion RecognitionWeizhou Shen, Siyue Wu, Yunyi Yang, Xiaojun Quan. 1551-1560 [doi]

Improving Formality Style Transfer with Context-Aware Rule InjectionZonghai Yao, Hong Yu. 1561-1570 [doi]

Topic-Driven and Knowledge-Aware Transformer for Dialogue Emotion DetectionLixing Zhu, Gabriele Pergola, Lin Gui 0003, Deyu Zhou, Yulan He. 1571-1582 [doi]

Syntopical Graphs for Computational Argumentation TasksJoe Barrow, Rajiv Jain, Nedim Lipka, Franck Dernoncourt, Vlad I. Morariu, Varun Manjunatha, Douglas W. Oard, Philip Resnik, Henning Wachsmuth. 1583-1595 [doi]

Stance Detection in COVID-19 TweetsKyle Glandt, Sarthak Khanal, Yingjie Li, Doina Caragea, Cornelia Caragea. 1596-1611 [doi]

Topic-Aware Evidence Reasoning and Stance-Aware Aggregation for Fact VerificationJiasheng Si, Deyu Zhou, Tongzhe Li, Xingyu Shi, Yulan He. 1612-1622 [doi]

Changes in European Solidarity Before and During COVID-19: Evidence from a Large Crowd- and Expert-Annotated Twitter DatasetAlexandra Ils, Dan Liu, Daniela Grunow, Steffen Eger. 1623-1637 [doi]

Measuring Conversational Uptake: A Case Study on Student-Teacher InteractionsDorottya Demszky, Jing Liu, Zid Mancenido, Julie Cohen, Heather Hill, Dan Jurafsky, Tatsunori Hashimoto. 1638-1653 [doi]

A Survey of Code-switching: Linguistic and Social Perspectives for Language TechnologiesA Seza Dogruöz, Sunayana Sitaram, Barbara E. Bullock, Almeida Jacqueline Toribio. 1654-1666 [doi]

Learning from the Worst: Dynamically Generated Datasets to Improve Online Hate DetectionBertie Vidgen, Tristan Thrush, Zeerak Waseem, Douwe Kiela. 1667-1682 [doi]

InfoSurgeon: Cross-Media Fine-grained Information Consistency Checking for Fake News DetectionYi Fung, Christopher Thomas, Revanth Gangi Reddy, Sandeep Polisetty, Heng Ji, Shih-Fu Chang, Kathleen R. McKeown, Mohit Bansal, Avi Sil. 1683-1698 [doi]

I like fish, especially dolphins: Addressing Contradictions in Dialogue ModelingYixin Nie, Mary Williamson, Mohit Bansal, Douwe Kiela, Jason Weston. 1699-1713 [doi]

A Sequence-to-Sequence Approach to Dialogue State TrackingYue Feng, Yang Wang, Hang Li. 1714-1725 [doi]

Discovering Dialog Structure Graph for Coherent Dialog GenerationJun Xu 0027, Zeyang Lei, Haifeng Wang 0001, Zheng-Yu Niu, Hua Wu, Wanxiang Che. 1726-1739 [doi]

Dialogue Response Selection with Hierarchical Curriculum LearningYixuan Su, Deng Cai 0002, Qingyu Zhou, Zibo Lin, Simon Baker, Yunbo Cao, Shuming Shi 0001, Nigel Collier, Yan Wang 0060. 1740-1751 [doi]

A Joint Model for Dropped Pronoun Recovery and Conversational Discourse Parsing in Chinese Conversational SpeechJingxuan Yang, Kerui Xu, Jun Xu, Si Li, Sheng Gao, Jun Guo 0002, Nianwen Xue, Ji-Rong Wen. 1752-1763 [doi]

A Systematic Investigation of KB-Text Embedding Alignment at ScaleVardaan Pahuja, Yu Gu, Wenhu Chen, Mehdi Bahrami, Lei Liu, Wei-Peng Chen, Yu Su. 1764-1774 [doi]

Named Entity Recognition with Small Strongly Labeled and Large Weakly Labeled DataHaoming Jiang, Danqing Zhang, Tianyu Cao, Bing Yin, Tuo Zhao. 1775-1789 [doi]

Ultra-Fine Entity Typing with Weak Supervision from a Masked Language ModelHongliang Dai, Yangqiu Song, Haixun Wang. 1790-1799 [doi]

Improving Named Entity Recognition by External Context Retrieving and Cooperative LearningXinyu Wang 0013, Yong Jiang, Nguyen Bach, Tao Wang 0056, Zhongqiang Huang, Fei Huang, Kewei Tu. 1800-1812 [doi]

Implicit Representations of Meaning in Neural Language ModelsBelinda Z. Li, Maxwell I. Nye, Jacob Andreas. 1813-1827 [doi]

Causal Analysis of Syntactic Agreement Mechanisms in Neural Language ModelsMatthew Finlayson, Aaron Mueller, Sebastian Gehrmann, Stuart M. Shieber, Tal Linzen, Yonatan Belinkov. 1828-1843 [doi]

Bird's Eye: Probing for Linguistic Graph Structures with a Simple Information-Theoretic ApproachYifan Hou, Mrinmaya Sachan. 1844-1859 [doi]

Knowledgeable or Educated Guess? Revisiting Language Models as Knowledge BasesBoxi Cao, Hongyu Lin, Xianpei Han, Le Sun 0001, Lingyong Yan, Meng Liao, Tong Xue, Jin Xu. 1860-1874 [doi]

Poisoning Knowledge Graph Embeddings via Relation Inference PatternsPeru Bhardwaj, John D. Kelleher, Luca Costabello, Declan O'Sullivan. 1875-1888 [doi]

Bad Seeds: Evaluating Lexical Methods for Bias MeasurementMaria Antoniak, David Mimno. 1889-1904 [doi]

A Survey of Race, Racism, and Anti-Racism in NLPAnjalie Field, Su Lin Blodgett, Zeerak Waseem, Yulia Tsvetkov. 1905-1925 [doi]

Intrinsic Bias Metrics Do Not Correlate with Application BiasSeraphina Goldfarb-Tarrant, Rebecca Marchant, Ricardo Muñoz Sánchez, Mugdha Pandya, Adam Lopez. 1926-1940 [doi]

RedditBias: A Real-World Resource for Bias Evaluation and Debiasing of Conversational Language ModelsSoumya Barikeri, Anne Lauscher, Ivan Vulic, Goran Glavas. 1941-1955 [doi]

Contributions of Transformer Attention Heads in Multi- and Cross-lingual TasksWeicheng Ma, Kai Zhang, Renze Lou, Lili Wang, Soroush Vosoughi. 1956-1966 [doi]

Crafting Adversarial Examples for Neural Machine TranslationXinze Zhang, Junzhe Zhang, Zhenhua Chen, Kun He 0001. 1967-1977 [doi]

UXLA: A Robust Unsupervised Data Augmentation Framework for Zero-Resource Cross-Lingual NLPM. Saiful Bari, Tasnim Mohiuddin, Shafiq R. Joty. 1978-1992 [doi]

Glancing Transformer for Non-Autoregressive Neural Machine TranslationLihua Qian, Hao Zhou, Yu Bao, Mingxuan Wang, Lin Qiu, Weinan Zhang 0001, Yong Yu, Lei Li. 1993-2003 [doi]

Hierarchical Context-aware Network for Dense Video Event CaptioningLei Ji, Xianglin Guo, Haoyang Huang, Xilin Chen. 2004-2013 [doi]

Control Image Captioning Spatially and TemporallyKun Yan, Lei Ji, Huaishao Luo, Ming Zhou 0001, Nan Duan, Shuai Ma 0001. 2014-2025 [doi]

Edited Media Understanding Frames: Reasoning About the Intent and Implications of Visual MisinformationJeff Da, Maxwell Forbes, Rowan Zellers, Anthony Zheng, Jena D. Hwang, Antoine Bosselut, Yejin Choi. 2026-2039 [doi]

PIGLeT: Language Grounding Through Neuro-Symbolic Interaction in a 3D WorldRowan Zellers, Ari Holtzman, Matthew E. Peters, Roozbeh Mottaghi, Aniruddha Kembhavi, Ali Farhadi, Yejin Choi. 2040-2050 [doi]

Modeling Fine-Grained Entity Types with Box EmbeddingsYasumasa Onoe, Michael Boratko, Andrew McCallum, Greg Durrett. 2051-2064 [doi]

ChineseBERT: Chinese Pretraining Enhanced by Glyph and Pinyin InformationZijun Sun, Xiaoya Li, Xiaofei Sun, Yuxian Meng, Xiang Ao, Qing He 0003, Fei Wu, Jiwei Li. 2065-2075 [doi]

Weight Distillation: Transferring the Knowledge in Neural Network ParametersYe-Lin, Yanyang Li, Ziyang Wang, Bei Li, Quan Du, Tong Xiao, Jingbo Zhu. 2076-2088 [doi]

Optimizing Deeper Transformers on Small DatasetsPeng Xu, Dhruv Kumar 0005, Wei Yang, Wenjie Zi, Keyi Tang, Chenyang Huang 0001, Jackie Chi Kit Cheung, Simon J. D. Prince, Yanshuai Cao. 2089-2102 [doi]

BERTAC: Enhancing Transformer-based Language Models with Adversarially Pretrained Convolutional Neural NetworksJong-Hoon Oh, Ryu Iida, Julien Kloetzer, Kentaro Torisawa. 2103-2115 [doi]

COVID-Fact: Fact Extraction and Verification of Real-World Claims on COVID-19 PandemicArkadiy Saakyan, Tuhin Chakrabarty, Smaranda Muresan. 2116-2129 [doi]

Explaining Relationships Between Scientific DocumentsKelvin Luu, Xinyi Wu, Rik Koncel-Kedziorski, Kyle Lo, Isabel Cachola, Noah A. Smith. 2130-2144 [doi]

IrEne: Interpretable Energy Prediction for TransformersQingqing Cao, Yash Kumar Lal, Harsh Trivedi, Aruna Balasubramanian, Niranjan Balasubramanian. 2145-2157 [doi]

Mitigating Bias in Session-based Cyberbullying Detection: A Non-Compromising ApproachLu Cheng, Ahmadreza Mosallanezhad, Yasin N. Silva, Deborah L. Hall, Huan Liu 0001. 2158-2168 [doi]

PlotCoder: Hierarchical Decoding for Synthesizing Visualization Code in Programmatic ContextXinyun Chen, Linyuan Gong, Alvin Cheung, Dawn Song. 2169-2181 [doi]

Changing the World by Changing the DataAnna Rogers. 2182-2194 [doi]

EarlyBERT: Efficient BERT Training via Early-bird Lottery TicketsXiaohan Chen, Yu Cheng 0001, Shuohang Wang, Zhe Gan, Zhangyang Wang, Jingjing Liu. 2195-2207 [doi]

On the Effectiveness of Adapter-based Tuning for Pretrained Language Model AdaptationRuidan He, Linlin Liu, Hai Ye, Qingyu Tan, Bosheng Ding, LiYing Cheng, Jia-Wei Low, Lidong Bing, Luo Si. 2208-2222 [doi]

Data Augmentation for Text Generation Without Any Augmented DataWei Bi, Huayang Li, JiaCheng Huang. 2223-2237 [doi]

Integrating Semantics and Neighborhood Information with Graph-Driven Generative Models for Document RetrievalZijing Ou, Qinliang Su, Jianxing Yu, Bang Liu, Jingwen Wang, Ruihui Zhao, Changyou Chen, Yefeng Zheng. 2238-2249 [doi]

SMURF: SeMantic and linguistic UndeRstanding Fusion for Caption Evaluation via Typicality AnalysisJoshua Feinglass, Yezhou Yang. 2250-2260 [doi]

KaggleDBQA: Realistic Evaluation of Text-to-SQL ParsersChia-Hsuan Lee, Oleksandr Polozov, Matthew Richardson. 2261-2273 [doi]

QASR: QCRI Aljazeera Speech Resource A Large Scale Annotated Arabic Speech CorpusHamdy Mubarak, Amir Hussein, Shammur Absar Chowdhury, Ahmed Ali. 2274-2285 [doi]

An Empirical Study on Hyperparameter Optimization for Fine-Tuning Pre-trained Language ModelsXueqing Liu, Chi Wang. 2286-2300 [doi]

Better than Average: Paired Evaluation of NLP systemsMaxime Peyrard, Wei Zhao, Steffen Eger, Robert West 0001. 2301-2315 [doi]

Chase: A Large-Scale and Pragmatic Chinese Dataset for Cross-Database Context-Dependent Text-to-SQLJiaqi Guo, Ziliang Si, Yu Wang, Qian Liu, Ming Fan, Jian-Guang Lou, Zijiang Yang, Ting Liu. 2316-2331 [doi]

CLINE: Contrastive Learning with Semantic Negative Examples for Natural Language UnderstandingDong Wang, Ning Ding, Piji Li, Haitao Zheng. 2332-2342 [doi]

Tree-Structured Topic Modeling with Nonparametric Neural Variational InferenceZiye Chen, Cheng Ding, Zusheng Zhang, Yanghui Rao, Haoran Xie 0001. 2343-2353 [doi]

ExCAR: Event Graph Knowledge Enhanced Explainable Causal ReasoningLi Du, Xiao Ding, Kai Xiong, Ting Liu 0001, Bing Qin 0001. 2354-2363 [doi]

Distributed Representations of Emotion Categories in Emotion SpaceXiangyu Wang, Chengqing Zong. 2364-2375 [doi]

Style is NOT a single variable: Case Studies for Cross-Stylistic Language UnderstandingDongyeop Kang, Eduard H. Hovy. 2376-2387 [doi]

DynaSent: A Dynamic Benchmark for Sentiment AnalysisChristopher Potts, Zhengxuan Wu, Atticus Geiger, Douwe Kiela. 2388-2404 [doi]

A Hierarchical VAE for Calibrating Attributes while Generating Text using Normalizing FlowBidisha Samanta, Mohit Agrawal, Niloy Ganguly. 2405-2415 [doi]

A Unified Generative Framework for Aspect-based Sentiment AnalysisHang Yan, Junqi Dai, Tuo Ji, Xipeng Qiu, Zheng Zhang 0001. 2416-2429 [doi]

Discovering Dialogue Slots with Weak SupervisionVojtech Hudecek, Ondrej Dusek, Zhou Yu. 2430-2442 [doi]

Enhancing the generalization for Intent Classification and Out-of-Domain Detection in SLUYilin Shen, Yen-Chang Hsu, Avik Ray, Hongxia Jin. 2443-2453 [doi]

ProtAugment: Intent Detection Meta-Learning through Unsupervised Diverse ParaphrasingThomas Dopierre, Christophe Gravier, Wilfried Logerais. 2454-2466 [doi]

Robustness Testing of Language Understanding in Task-Oriented DialogJiexi Liu, Ryuichi Takanobu, Jiaxin Wen, Dazhen Wan, Hongguang Li, Weiran Nie, Cheng Li, Wei Peng, Minlie Huang. 2467-2480 [doi]

Comprehensive Study: How the Context Information of Different Granularity Affects Dialogue State Tracking?Puhai Yang, Heyan Huang, Xian-Ling Mao. 2481-2491 [doi]

OTTers: One-turn Topic Transitions for Open-Domain DialogueKarin Sevegnani, David M. Howcroft, Ioannis Konstas, Verena Rieser. 2492-2504 [doi]

Towards Robustness of Text-to-SQL Models against Synonym SubstitutionYujian Gan, Xinyun Chen, Qiuping Huang, Matthew Purver, John R. Woodward, Jinxia Xie, Pengsheng Huang. 2505-2515 [doi]

KACE: Generating Knowledge Aware Contrastive Explanations for Natural Language InferenceQianglong Chen, Feng Ji, Xiangji Zeng, Feng-Lin Li, Ji Zhang, Haiqing Chen, Yin Zhang. 2516-2527 [doi]

Self-Guided Contrastive Learning for BERT Sentence RepresentationsTaeuk Kim, Kang Min Yoo, Sang-goo Lee. 2528-2540 [doi]

LGESQL: Line Graph Enhanced Text-to-SQL Model with Mixed Local and Non-Local RelationsRuisheng Cao, Lu Chen, Zhi Chen 0006, Yanbin Zhao, Su Zhu, Kai Yu 0004. 2541-2555 [doi]

Multi-stage Pre-training over Simplified Multimodal Pre-training ModelsTongtong Liu, Fangxiang Feng, Xiaojie Wang. 2556-2565 [doi]

Beyond Sentence-Level End-to-End Speech Translation: Context HelpsBiao Zhang, Ivan Titov, Barry Haddow, Rico Sennrich. 2566-2578 [doi]

LayoutLMv2: Multi-modal Pre-training for Visually-rich Document UnderstandingYang Xu, Yiheng Xu, Tengchao Lv, Lei Cui 0001, Furu Wei, Guoxin Wang, Yijuan Lu, Dinei A. F. Florêncio, Cha Zhang, Wanxiang Che, Min Zhang, Lidong Zhou. 2579-2591 [doi]

UNIMO: Towards Unified-Modal Understanding and Generation via Cross-Modal Contrastive LearningWei Li, Can Gao, Guocheng Niu, Xinyan Xiao, Hao Liu, Jiachen Liu, Hua Wu 0003, Haifeng Wang 0001. 2592-2607 [doi]

Missing Modality Imagination Network for Emotion Recognition with Uncertain Missing ModalitiesJinming Zhao, Ruichen Li, Qin Jin. 2608-2618 [doi]

Stacked Acoustic-and-Textual Encoding: Integrating the Pre-trained Models into Speech Translation EncodersChen Xu, Bojie Hu, Yanyang Li, Yuhao Zhang, Shen Huang, Qi Ju, Tong Xiao, Jingbo Zhu. 2619-2630 [doi]

N-ary Constituent Tree Parsing with Recursive Semi-Markov ModelXin Xin, Jinlong Li, Zeqi Tan. 2631-2642 [doi]

Automated Concatenation of Embeddings for Structured PredictionXinyu Wang 0013, Yong Jiang, Nguyen Bach, Tao Wang 0056, Zhongqiang Huang, Fei Huang, Kewei Tu. 2643-2660 [doi]

Multi-View Cross-Lingual Structured Prediction with Minimum SupervisionZechuan Hu, Yong Jiang, Nguyen Bach, Tao Wang 0056, Zhongqiang Huang, Fei Huang, Kewei Tu. 2661-2674 [doi]

The Limitations of Limited Context for Constituency ParsingYuchen Li, Andrej Risteski. 2675-2687 [doi]

Neural Bi-Lexicalized PCFG InductionSonglin Yang, Yanpeng Zhao, Kewei Tu. 2688-2699 [doi]

Ruddit: Norms of Offensiveness for English Reddit CommentsRishav Hada, Sohi Sudhir, Pushkar Mishra, Helen Yannakoudakis, Saif M. Mohammad, Ekaterina Shutova. 2700-2717 [doi]

Towards Quantifiable Dialogue Coherence EvaluationZheng Ye, Liucun Lu, Lishan Huang, Liang Lin, Xiaodan Liang. 2718-2729 [doi]

Assessing the Representations of Idiomaticity in Vector Models with a Noun Compound Dataset Labeled at Type and Token LevelsMarcos García, Tiago Kramer Vieira, Carolina Scarton, Marco Idiart, Aline Villavicencio. 2730-2741 [doi]

Factoring Statutory Reasoning as Language Understanding ChallengesNils Holzenberger, Benjamin Van Durme. 2742-2758 [doi]

Evaluating Evaluation Measures for Ordinal Classification and Ordinal QuantificationTetsuya Sakai. 2759-2769 [doi]

Interpretable and Low-Resource Entity Matching via Decoupling Feature Learning from Decision MakingZijun Yao, Chengjiang Li, Tiansi Dong, Xin Lv, Jifan Yu, Lei Hou 0001, Juanzi Li, Yichi Zhang, Zelin Dai. 2770-2781 [doi]

Locate and Label: A Two-stage Identifier for Nested Named Entity RecognitionYongliang Shen 0001, Xinyin Ma, Zeqi Tan, Shuai Zhang, Wen Wang, Weiming Lu 0001. 2782-2794 [doi]

Text2Event: Controllable Sequence-to-Structure Generation for End-to-end Event ExtractionYaojie Lu 0001, Hongyu Lin, Jin Xu, Xianpei Han, Jialong Tang, Annan Li, Le Sun 0001, Meng Liao, Shaoyi Chen. 2795-2806 [doi]

A Large-Scale Chinese Multimodal NER Dataset with Speech CluesDianbo Sui, Zhengkun Tian, Yubo Chen 0001, Kang Liu 0001, Jun Zhao 0001. 2807-2818 [doi]

A Neural Transition-based Joint Model for Disease Named Entity Recognition and NormalizationZongcheng Ji, Tian Xia, Mei Han, Jing Xiao 0006. 2819-2827 [doi]

OntoED: Low-resource Event Detection with Ontology EmbeddingShumin Deng, Ningyu Zhang, Luoqiu Li, Chen hui, Huaixiao Tou, Mosha Chen, Fei Huang, Huajun Chen. 2828-2839 [doi]

Self-Training Sampling with Monolingual Data Uncertainty for Neural Machine TranslationWenxiang Jiao, Xing Wang 0007, Zhaopeng Tu, Shuming Shi 0001, Michael R. Lyu, Irwin King. 2840-2850 [doi]

Breaking the Corpus Bottleneck for Context-Aware Neural Machine Translation with Cross-Task Pre-trainingLinqing Chen, Junhui Li, Zhengxian Gong, Boxing Chen, Weihua Luo, Min Zhang, Guodong Zhou. 2851-2861 [doi]

Guiding Teacher Forcing with Seer Forcing for Neural Machine TranslationYang Feng, Shuhao Gu, Dengji Guo, Zhengxin Yang, Chenze Shao. 2862-2872 [doi]

Cascade versus Direct Speech Translation: Do the Differences Still Make a Difference?Luisa Bentivogli, Mauro Cettolo, Marco Gaido, Alina Karakanta, Alberto Martinelli, Matteo Negri, Marco Turchi. 2873-2887 [doi]

Unsupervised Neural Machine Translation for Low-Resource Domains via Meta-LearningCheonbok Park, Yunwon Tae, Taehee Kim, Soyoung Yang, Mohammad Azam Khan, Lucy Park, Jaegul Choo. 2888-2901 [doi]

Lightweight Cross-Lingual Sentence Representation LearningZhuoyuan Mao, Prakhar Gupta, Chenhui Chu, Martin Jaggi, Sadao Kurohashi. 2902-2913 [doi]

ERNIE-Doc: A Retrospective Long-Document Modeling TransformerSiyu Ding, Junyuan Shang, Shuohuan Wang, Yu Sun, Hao Tian, Hua Wu, Haifeng Wang 0001. 2914-2927 [doi]

Marginal Utility Diminishes: Exploring the Minimum Knowledge for BERT Knowledge DistillationYuanxin Liu, Fandong Meng, Zheng Lin 0001, Weiping Wang 0005, Jie Zhou 0016. 2928-2941 [doi]

Rational LAMOL: A Rationale-based Lifelong Learning FrameworkKasidis Kanwatchara, Thanapapas Horsuwan, Piyawat Lertvittayakumjorn, Boonserm Kijsirikul, Peerapon Vateekul. 2942-2953 [doi]

EnsLM: Ensemble Language Model for Data Diversity by Semantic ClusteringZhibin Duan, Hao Zhang 0050, Chaojie Wang 0001, Zhengjue Wang, Bo Chen 0001, Mingyuan Zhou. 2954-2967 [doi]

LeeBERT: Learned Early Exit for BERT with cross-level optimizationWei Zhu. 2968-2980 [doi]

Unsupervised Extractive Summarization-Based Representations for Accurate and Explainable Collaborative FilteringReinald Adrian Pugoy, Hung-Yu Kao. 2981-2990 [doi]

PLOME: Pre-training with Misspelled Knowledge for Chinese Spelling CorrectionShulin Liu, Tao Yang, Tianchi Yue, Feng Zhang, Di Wang. 2991-3000 [doi]

Competence-based Multimodal Curriculum Learning for Medical Report GenerationFenglin Liu, Shen Ge, Xian Wu. 3001-3012 [doi]

Learning Syntactic Dense Embedding with Correlation Graph for Automatic Readability AssessmentXinYing Qiu, Yuan Chen, Hanwu Chen, Jian-Yun Nie, Yuming Shen, Dawei Lu. 3013-3025 [doi]

Meta-KD: A Meta Knowledge Distillation Framework for Language Model Compression across DomainsHaojie Pan, Chengyu Wang 0001, Minghui Qiu, Yichang Zhang, Yaliang Li, Jun Huang 0007. 3026-3036 [doi]

A Semantic-based Method for Unsupervised Commonsense Question AnsweringYilin Niu, Fei Huang, Jiaming Liang, Wenkai Chen, Xiaoyan Zhu 0001, Minlie Huang. 3037-3049 [doi]

Explanations for CommonsenseQA: New Dataset and ModelsShourya Aggarwal, Divyanshu Mandowara, Vishwajeet Agrawal, Dinesh Khandelwal, Parag Singla, Dinesh Garg. 3050-3065 [doi]

Few-Shot Question Answering by Pretraining Span SelectionOri Ram, Yuval Kirstain, Jonathan Berant, Amir Globerson, Omer Levy. 3066-3079 [doi]

UnitedQA: A Hybrid Approach for Open Domain Question AnsweringHao Cheng 0002, Yelong Shen, Xiaodong Liu, Pengcheng He, Weizhu Chen, Jianfeng Gao. 3080-3090 [doi]

Database reasoning over textJames Thorne, Majid Yazdani, Marzieh Saeidi, Fabrizio Silvestri, Sebastian Riedel 0001, Alon Y. Halevy. 3091-3104 [doi]

Online Learning Meets Machine Translation Evaluation: Finding the Best Systems with the Least Human EffortVânia Mendonça, Ricardo Rei, Luísa Coheur, Alberto Sardinha, Ana Lúcia Santos. 3105-3117 [doi]

How Good is Your Tokenizer? On the Monolingual Performance of Multilingual Language ModelsPhillip Rust, Jonas Pfeiffer, Ivan Vulic, Sebastian Ruder, Iryna Gurevych. 3118-3135 [doi]

Evaluating morphological typology in zero-shot cross-lingual transferAntonio Martínez-García, Toni Badia, Jeremy Barnes. 3136-3153 [doi]

From Machine Translation to Code-Switching: Generating High-Quality Code-Switched TextIshan Tarunesh, Syamantak Kumar, Preethi Jyothi. 3154-3169 [doi]

Fast and Accurate Neural Machine Translation with Translation MemoryQiuxiang He, Guoping Huang, Qu Cui, Li Li, Lemao Liu. 3170-3180 [doi]

Annotating Online MisogynyPhiline Zeinert, Nanna Inie, Leon Derczynski. 3181-3197 [doi]

Few-NERD: A Few-shot Named Entity Recognition DatasetNing Ding, Guangwei Xu, Yulin Chen, XiaoBin Wang, Xu Han, Pengjun Xie, Haitao Zheng, Zhiyuan Liu. 3198-3213 [doi]

MultiMET: A Multimodal Dataset for Metaphor UnderstandingDongyu Zhang, Minghao Zhang, Heting Zhang, Liang Yang 0003, Hongfei Lin. 3214-3225 [doi]

Human-in-the-Loop for Data Collection: a Multi-Target Counter Narrative Dataset to Fight Online Hate SpeechMargherita Fanton, Helena Bonaldi, Serra Sinem Tekiroglu, Marco Guerini. 3226-3240 [doi]

Can Generative Pre-trained Language Models Serve As Knowledge Bases for Closed-book QA?Cunxiang Wang, Pai Liu, Yue Zhang 0004. 3241-3251 [doi]

Joint Models for Answer Verification in Question Answering SystemsZeyu Zhang, Thuy Vu, Alessandro Moschitti. 3252-3262 [doi]

Answering Ambiguous Questions through Generative Evidence Fusion and Round-Trip PredictionYiFan Gao, Henghui Zhu, Patrick Ng, Cícero Nogueira dos Santos, Zhiguo Wang, Feng Nan, Dejiao Zhang, Ramesh Nallapati, Andrew O. Arnold, Bing Xiang. 3263-3276 [doi]

TAT-QA: A Question Answering Benchmark on a Hybrid of Tabular and Textual Content in FinanceFengbin Zhu, Wenqiang Lei, Youcheng Huang, Chao Wang, Shuo Zhang, Jiancheng Lv, Fuli Feng, Tat-Seng Chua. 3277-3287 [doi]

Modeling Transitions of Focal Entities for Conversational Knowledge Base Question AnsweringYunshi Lan, Jing Jiang 0002. 3288-3297 [doi]

Evidence-based Factual Error CorrectionJames Thorne, Andreas Vlachos 0001. 3298-3309 [doi]

Probabilistic, Structure-Aware Algorithms for Improved Variety, Accuracy, and Coverage of AMR AlignmentsAustin Blodgett, Nathan Schneider. 3310-3321 [doi]

Meta-Learning to Compositionally GeneralizeHenry Conklin, Bailin Wang, Kenny Smith, Ivan Titov. 3322-3335 [doi]

Taming Pre-trained Language Models with N-gram Representations for Low-Resource Domain AdaptationShizhe Diao, Ruijia Xu, Hongjin Su, Yilei Jiang, Yan Song, Tong Zhang. 3336-3349 [doi]

ERICA: Improving Entity and Relation Understanding for Pre-trained Language Models via Contrastive LearningYujia Qin, Yankai Lin, Ryuichi Takanobu, Zhiyuan Liu 0001, Peng Li 0030, Heng Ji, Minlie Huang, Maosong Sun, Jie Zhou 0016. 3350-3363 [doi]

Position Bias Mitigation: A Knowledge-Aware Graph Model for Emotion Cause ExtractionHanqi Yan, Lin Gui 0003, Gabriele Pergola, Yulan He. 3364-3375 [doi]

Every Bite Is an Experience: Key Point Analysis of Business ReviewsRoy Bar-Haim, Lilach Eden, Yoav Kantor, Roni Friedman, Noam Slonim. 3376-3386 [doi]

Structured Sentiment Analysis as Dependency Graph ParsingJeremy Barnes, Robin Kurtz, Stephan Oepen, Lilja Øvrelid, Erik Velldal. 3387-3402 [doi]

Consistency Regularization for Cross-Lingual Fine-TuningBo Zheng, Li Dong 0004, Shaohan Huang, Wenhui Wang, Zewen Chi, Saksham Singhal, Wanxiang Che, Ting Liu 0001, Xia Song, Furu Wei. 3403-3417 [doi]

Improving Pretrained Cross-Lingual Language Models via Self-Labeled Word AlignmentZewen Chi, Li Dong 0004, Bo Zheng, Shaohan Huang, Xian-Ling Mao, Heyan Huang, Furu Wei. 3418-3430 [doi]

Rejuvenating Low-Frequency Words: Making the Most of Parallel Data in Non-Autoregressive TranslationLiang Ding, Longyue Wang, Xuebo Liu 0002, Derek F. Wong, Dacheng Tao, Zhaopeng Tu. 3431-3441 [doi]

G-Transformer for Document-Level Machine TranslationGuangsheng Bao, Yue Zhang 0004, Zhiyang Teng, Boxing Chen, Weihua Luo. 3442-3455 [doi]

Prevent the Language Model from being Overconfident in Neural Machine TranslationMengqi Miao, Fandong Meng, Yijin Liu, Xiao-Hua Zhou, Jie Zhou 0016. 3456-3468 [doi]

Towards Emotional Support Dialog SystemsSiyang Liu, Chujie Zheng, Orianna DeMasi, Sahand Sabour, Yu Li, Zhou Yu, Yong Jiang, Minlie Huang. 3469-3483 [doi]

Novel Slot Detection: A Benchmark for Discovering Unknown Slot Types in the Task-Oriented Dialogue SystemYanan Wu, Zhiyuan Zeng, Keqing He, Hong Xu, Yuanmeng Yan, Huixing Jiang, Weiran Xu. 3484-3494 [doi]

GTM: A Generative Triple-wise Model for Conversational Question GenerationLei Shen, Fandong Meng, Jinchao Zhang, Yang Feng, Jie Zhou 0016. 3495-3506 [doi]

Diversifying Dialog Generation via Adaptive Label SmoothingYida Wang, Yinhe Zheng, Yong Jiang, Minlie Huang. 3507-3520 [doi]

Out-of-Scope Intent Detection with Self-Supervision and Discriminative TrainingLi-Ming Zhan, Haowen Liang, Bo Liu, Lu Fan, Xiao-Ming Wu, Albert Y. S. Lam. 3521-3532 [doi]

Document-level Event Extraction via Heterogeneous Graph-based Interaction Model with a TrackerRunxin Xu, Tianyu Liu, Lei Li, Baobao Chang. 3533-3546 [doi]

Nested Named Entity Recognition via Explicitly Excluding the Influence of the Best PathYiran Wang, Hiroyuki Shindo, Yuji Matsumoto 0001, Taro Watanabe. 3547-3557 [doi]

LearnDA: Learnable Knowledge-Guided Data Augmentation for Event Causality IdentificationXinyu Zuo, Pengfei Cao, Yubo Chen 0001, Kang Liu 0001, Jun Zhao 0001, Weihua Peng, Yuguang Chen. 3558-3571 [doi]

Revisiting the Negative Data of Distantly Supervised Relation ExtractionChenhao Xie 0002, Jiaqing Liang, JingPing Liu, Chengsong Huang, Wenhao Huang, Yanghua Xiao. 3572-3581 [doi]

Knowing the No-match: Entity Alignment with Dangling CasesZequn Sun, Muhao Chen, Wei Hu. 3582-3593 [doi]

Superbizarre Is Not Superb: Derivational Morphology Improves BERT's Interpretation of Complex WordsValentin Hofmann, Janet B. Pierrehumbert, Hinrich Schütze. 3594-3608 [doi]

BERT is to NLP what AlexNet is to CV: Can Pre-Trained Language Models Identify Analogies?Asahi Ushio, Luis Espinosa Anke, Steven Schockaert, José Camacho-Collados. 3609-3624 [doi]

Exploring the Representation of Word Meanings in Context: A Case Study on Homonymy and SynonymyMarcos Garcia. 3625-3640 [doi]

Measuring Fine-Grained Domain Relevance of Terms: A Hierarchical Core-Fringe ApproachJie Huang, Kevin Chang, Jinjun Xiong, Wen-mei Hwu. 3641-3651 [doi]

HERALD: An Annotation Efficient Method to Detect User Disengagement in Social ConversationsWeixin Liang, Kaihui Liang, Zhou Yu. 3652-3665 [doi]

Value-Agnostic Conversational Semantic ParsingEmmanouil Antonios Platanios, Adam Pauls, Subhro Roy, Yuchen Zhang, Alexander Kyte, Alan Guo, Sam Thomson, Jayant Krishnamurthy, Jason Andrew Wolfe, Jacob Andreas, Dan Klein. 3666-3681 [doi]

MPC-BERT: A Pre-Trained Language Model for Multi-Party Conversation UnderstandingJia-Chen Gu, Chongyang Tao, Zhen-Hua Ling, Can Xu, Xiubo Geng, Daxin Jiang. 3682-3692 [doi]

Best of Both Worlds: Making High Accuracy Non-incremental Transformer-based Disfluency Detection IncrementalMorteza Rohanian, Julian Hough. 3693-3703 [doi]

NeuralWOZ: Learning to Collect Task-Oriented Dialogue via Model-Based SimulationSungdong Kim, Minsuk Chang, Sang-Woo Lee. 3704-3717 [doi]

CDRNN: Discovering Complex Dynamics in Human Language ProcessingCory Shain. 3718-3734 [doi]

Structural Guidance for Transformer Language ModelsPeng Qian, Tahira Naseem, Roger Levy, Ramón Fernandez Astudillo. 3735-3745 [doi]

Surprisal Estimators for Human Reading Times Need Character ModelsByung-Doh Oh, Christian Clark, William Schuler. 3746-3757 [doi]

CogAlign: Learning to Align Textual Neural Representations to Cognitive Language Processing SignalsYuqi Ren, Deyi Xiong. 3758-3769 [doi]

Self-Attention Networks Can Process Bounded Hierarchical LanguagesShunyu Yao, Binghui Peng, Christos Papadimitriou, Karthik Narasimhan. 3770-3785 [doi]

TextSETTR: Few-Shot Text Style Extraction and Tunable Targeted RestylingParker Riley, Noah Constant, Mandy Guo, Girish Kumar, David C. Uthus, Zarana Parekh. 3786-3800 [doi]

H-Transformer-1D: Fast One-Dimensional Hierarchical Attention for SequencesZhenhai Zhu, Radu Soricut. 3801-3815 [doi]

Making Pre-trained Language Models Better Few-shot LearnersTianyu Gao, Adam Fisch, Danqi Chen. 3816-3830 [doi]

A Sweet Rabbit Hole by DARCY: Using Honeypots to Detect Universal Trigger's Adversarial AttacksThai Le, Noseong Park, Dongwon Lee 0001. 3831-3844 [doi]

Towards Propagation Uncertainty: Edge-enhanced Bayesian Graph Convolutional Networks for Rumor DetectionLingwei Wei, Dou Hu, Wei Zhou, Zhaojuan Yue, Songlin Hu. 3845-3854 [doi]

Label-Specific Dual Graph Neural Network for Multi-Label Text ClassificationQianwen Ma, Chunyuan Yuan, Wei Zhou, Songlin Hu. 3855-3864 [doi]

TAN-NTM: Topic Attention Networks for Neural Topic ModelingMadhur Panwar, Shashank Shailabh, Milan Aggarwal, Balaji Krishnamurthy. 3865-3880 [doi]

Cross-language Sentence Selection via Data Augmentation and Rationale TrainingYanda Chen, Chris Kedzie, Suraj Nair, Petra Galuscáková, Rui Zhang, Douglas W. Oard, Kathleen R. McKeown. 3881-3895 [doi]

A Neural Model for Joint Document and Snippet Ranking in Question Answering for Large Document CollectionsDimitris Pappas, Ion Androutsopoulos. 3896-3907 [doi]

W-RST: Towards a Weighted RST-style Discourse FrameworkPatrick Huber, Wen Xiao, Giuseppe Carenini. 3908-3918 [doi]

ABCD: A Graph Framework to Convert Complex Sentences to a Covering Set of Simple SentencesYanjun Gao, Ting-Hao Huang, Rebecca J. Passonneau. 3919-3931 [doi]

Which Linguist Invented the Lightbulb? Presupposition Verification for Question-AnsweringNajoung Kim, Ellie Pavlick, Burcu Karagol-Ayan, Deepak Ramachandran. 3932-3945 [doi]

Adversarial Learning for Discourse Rhetorical Structure ParsingLongyin Zhang, Fang Kong 0001, Guodong Zhou. 3946-3957 [doi]

Exploring Discourse Structures for Argument Impact ClassificationXin Liu, Jiefu Ou, Yangqiu Song, Xin Jiang. 3958-3969 [doi]

Point, Disambiguate and Copy: Incorporating Bilingual Dictionaries for Neural Machine TranslationTong Zhang, Long Zhang, Wei Ye, Bo Li, Jinan Sun, Xiaoyu Zhu, Wen Zhao, Shikun Zhang. 3970-3979 [doi]

VECO: Variable and Flexible Cross-lingual Pre-training for Language Understanding and GenerationFuli Luo, Wei Wang 0225, Jiahao Liu, Yijia Liu, Bin Bi, Songfang Huang, Fei Huang, Luo Si. 3980-3994 [doi]

A unified approach to sentence segmentation of punctuated text in many languagesRachel Wicks, Matt Post. 3995-4007 [doi]

Towards User-Driven Neural Machine TranslationHuan Lin, Liang Yao, Baosong Yang, Dayiheng Liu, Haibo Zhang, Weihua Luo, Degen Huang, Jinsong Su. 4008-4018 [doi]

End-to-End Lexically Constrained Machine Translation for Morphologically Rich LanguagesJosef Jon, João Paulo Aires, Dusan Varis, Ondrej Bojar. 4019-4033 [doi]

Handling Extreme Class Imbalance in Technical Logbook DatasetsFarhad Akhbardeh, Cecilia Ovesdotter Alm, Marcos Zampieri, Travis Desell. 4034-4045 [doi]

ILDC for CJPE: Indian Legal Documents Corpus for Court Judgment Prediction and ExplanationVijit Malik, Rishabh Sanjay, Shubham Kumar Nigam, Kripabandhu Ghosh, Shouvik Kumar Guha, Arnab Bhattacharya, Ashutosh Modi. 4046-4062 [doi]

Supporting Cognitive and Emotional Empathic Writing of StudentsThiemo Wambsganss, Christina Niklaus, Matthias Söllner 0001, Siegfried Handschuh, Jan Marco Leimeister. 4063-4077 [doi]

Dual Reader-Parser on Hybrid Textual and Tabular Evidence for Open Domain Question AnsweringAlexander Hanbo Li, Patrick Ng, Peng Xu, Henghui Zhu, Zhiguo Wang, Bing Xiang. 4078-4088 [doi]

Generation-Augmented Retrieval for Open-Domain Question AnsweringYuning Mao, Pengcheng He, Xiaodong Liu, Yelong Shen, Jianfeng Gao, Jiawei Han 0001, Weizhu Chen. 4089-4100 [doi]

Check It Again: Progressive Visual Question Answering via Visual EntailmentQingyi Si, Zheng Lin 0001, Mingyu Zheng, Peng Fu 0008, Weiping Wang 0005. 4101-4110 [doi]

A Mutual Information Maximization Approach for the Spurious Solution Problem in Weakly Supervised Question AnsweringZhihong Shao, Lifeng Shang, Qun Liu, Minlie Huang. 4111-4124 [doi]

Breaking Down Walls of Text: How Can NLP Benefit Consumer Privacy?Abhilasha Ravichander, Alan W. Black, Thomas B. Norton, Shomir Wilson, Norman M. Sadeh. 4125-4140 [doi]

Supporting Land Reuse of Former Open Pit Mining Sites using Text Classification and Active LearningChristopher Schröder, Kim Bürgl, Yves Annanias, Andreas Niekler, Lydia Müller, Daniel Wiegreffe, Christian Bender, Christoph Mengs, Gerik Scheuermann, Gerhard Heyer. 4141-4152 [doi]

Reliability Testing for Natural Language Processing SystemsSamson Tan, Shafiq R. Joty, Kathy Baxter, Araz Taeihagh, Gregory A. Bennett, Min-Yen Kan. 4153-4169 [doi]

Learning Language and Multimodal Privacy-Preserving Markers of Mood from Mobile DataPaul Pu Liang, Terrance Liu, Anna Cai, Michal Muszynski, Ryo Ishii, Nick Allen, Randy Auerbach, David Brent, Ruslan Salakhutdinov, Louis-Philippe Morency. 4170-4187 [doi]

Anonymisation Models for Text Data: State of the art, Challenges and Future DirectionsPierre Lison, Ildikó Pilán, David Sánchez 0001, Montserrat Batet, Lilja Øvrelid. 4188-4203 [doi]

End-to-End AMR Corefencence ResolutionQiankun Fu, Linfeng Song, Wenyu Du, Yue Zhang 0004. 4204-4214 [doi]

How is BERT surprised? Layerwise detection of linguistic anomaliesBai Li, Zining Zhu, Guillaume Thomas, Yang Xu 0023, Frank Rudzicz. 4215-4228 [doi]

Psycholinguistic Tripartite Graph Network for Personality DetectionTao Yang, Feifan Yang, Haolan Ouyang, Xiaojun Quan. 4229-4239 [doi]

Verb Metaphor Detection via Contextual Relation LearningWei Song, Shuhui Zhou, Ruiji Fu, Ting Liu, Lizhen Liu. 4240-4251 [doi]

Improving Speech Translation by Understanding and Learning from the Auxiliary Text Translation TaskYun Tang, Juan Pino, Xian Li, Changhan Wang, Dmitriy Genzel. 4252-4261 [doi]

Probing Toxic Content in Large Pre-Trained Language ModelsNedjma Ousidhoum, Xinran Zhao, Tianqing Fang, Yangqiu Song, Dit-Yan Yeung. 4262-4274 [doi]

Societal Biases in Language Generation: Progress and ChallengesEmily Sheng, Kai-Wei Chang, Prem Natarajan, Nanyun Peng. 4275-4293 [doi]

Reservoir TransformersSheng Shen, Alexei Baevski, Ari S. Morcos, Kurt Keutzer, Michael Auli, Douwe Kiela. 4294-4309 [doi]

Subsequence Based Deep Active Learning for Named Entity RecognitionPuria Radmard, Yassir Fathullah, Aldo Lipani. 4310-4321 [doi]

Convolutions and Self-Attention: Re-interpreting Relative Positions in Pre-trained Language ModelsTyler A. Chang, Yifan Xu, Weijian Xu, Zhuowen Tu. 4322-4333 [doi]

BinaryBERT: Pushing the Limit of BERT QuantizationHaoli Bai, Wei Zhang, Lu Hou, Lifeng Shang, Jin Jin, Xin Jiang, Qun Liu, Michael R. Lyu, Irwin King. 4334-4348 [doi]

Are Pretrained Convolutions Better than Pretrained Transformers?Yi Tay, Mostafa Dehghani 0001, Jai Prakash Gupta, Vamsi Aribandi, Dara Bahri, Zhen Qin 0002, Donald Metzler. 4349-4359 [doi]

PairRE: Knowledge Graph Embeddings via Paired Relation VectorsLinlin Chao, Jianshan He, Taifeng Wang, Wei Chu. 4360-4369 [doi]

Hierarchy-aware Label Semantics Matching Network for Hierarchical Text ClassificationHaibin Chen, Qianli Ma, Zhenxi Lin, Jiangyue Yan. 4370-4379 [doi]

HiddenCut: Simple Data Augmentation for Natural Language Understanding with Better GeneralizabilityJiaao Chen, Dinghan Shen, Weizhu Chen, Diyi Yang. 4380-4390 [doi]

Neural Stylistic Response Generation with Disentangled Latent VariablesQingfu Zhu, Wei-Nan Zhang 0003, Ting Liu 0001, William Yang Wang. 4391-4401 [doi]

Intent Classification and Slot Filling for Privacy PoliciesWasi Uddin Ahmad, Jianfeng Chi, Tu Le, Thomas Norton, Yuan Tian 0001, Kai-Wei Chang. 4402-4417 [doi]

RADDLE: An Evaluation Benchmark and Analysis Platform for Robust Task-oriented Dialog SystemsBaolin Peng, Chunyuan Li, Zhu Zhang, Chenguang Zhu, Jinchao Li, Jianfeng Gao. 4418-4429 [doi]

Semantic Representation for Dialogue ModelingXuefeng Bai, Yulong Chen, Linfeng Song, Yue Zhang 0004. 4430-4445 [doi]

A Pre-training Strategy for Zero-Resource Response Selection in Knowledge-Grounded ConversationsChongyang Tao, Changyu Chen, Jiazhan Feng, Ji-Rong Wen, Rui Yan 0001. 4446-4457 [doi]

Dependency-driven Relation Extraction with Attentive Graph Convolutional NetworksYuanhe Tian, Guimin Chen, Yan Song, Xiang Wan. 4458-4471 [doi]

Evaluating Entity Disambiguation and the Role of Popularity in Retrieval-Based NLPAnthony Chen, Pallavi Gudipati, Shayne Longpre, Xiao Ling, Sameer Singh 0001. 4472-4485 [doi]

Evaluation Examples are not Equally Informative: How should that change NLP Leaderboards?Pedro Rodriguez, Joe Barrow, Alexander Miserlis Hoyle, John P. Lalor, Robin Jia, Jordan L. Boyd-Graber. 4486-4503 [doi]

Claim Matching Beyond English to Scale Global Fact-CheckingAshkan Kazemi, Kiran Garimella, Devin Gaffney, Scott A. Hale. 4504-4517 [doi]

SemFace: Pre-training Encoder and Decoder with a Semantic Interface for Neural Machine TranslationShuo Ren, Long Zhou, Shujie Liu 0001, Furu Wei, Ming Zhou 0001, Shuai Ma 0001. 4518-4527 [doi]

Energy-Based Reranking: Improving Neural Machine Translation Using Energy-Based ModelsSumanta Bhattacharyya, Amirmohammad Rooshenas, Subhajit Naskar, Simeng Sun, Mohit Iyyer, Andrew McCallum. 4528-4537 [doi]

Syntax-augmented Multilingual BERT for Cross-lingual TransferWasi Ahmad, Haoran Li, Kai-Wei Chang, Yashar Mehdad. 4538-4554 [doi]

How to Adapt Your Pretrained Multilingual Model to 1600 LanguagesAbteen Ebrahimi, Katharina Kann. 4555-4567 [doi]

Weakly Supervised Named Entity Tagging with Learnable Logical RulesJiacheng Li, Haibo Ding, Jingbo Shang, Julian J. McAuley, Zhe Feng. 4568-4581 [doi]

Prefix-Tuning: Optimizing Continuous Prompts for GenerationXiang Lisa Li, Percy Liang. 4582-4597 [doi]

One2Set: Generating Diverse Keyphrases as a SetJiacheng Ye, Tao Gui, Yichao Luo, Yige Xu 0001, Qi Zhang. 4598-4608 [doi]

Continuous Language Generative FlowZineng Tang, Shiyue Zhang, Hyounghun Kim, Mohit Bansal. 4609-4622 [doi]

TWAG: A Topic-Guided Wikipedia Abstract GeneratorFangwei Zhu, Shangqing Tu, Jiaxin Shi, Juanzi Li, Lei Hou 0001, Tong Cui. 4623-4635 [doi]

ForecastQA: A Question Answering Challenge for Event Forecasting with Temporal Text DataWoojeong Jin, Rahul Khanna, Suji Kim, Dong-Ho Lee, Fred Morstatter, Aram Galstyan, Xiang Ren. 4636-4650 [doi]

Recursive Tree-Structured Self-Attention for Answer Sentence SelectionKhalil Mrini, Emilia Farcas, Ndapa Nakashole. 4651-4661 [doi]

How Knowledge Graph and Attention Help? A Qualitative Analysis into Bag-level Relation ExtractionZikun Hu, Yixin Cao 0002, Lifu Huang, Tat-Seng Chua. 4662-4671 [doi]

Trigger is Not Sufficient: Exploiting Frame-aware Knowledge for Implicit Event Argument ExtractionKaiwen Wei, Xian Sun, Zequn Zhang, Jingyuan Zhang, Zhi Guo, Li Jin. 4672-4682 [doi]

Element Intervention for Open Relation ExtractionFangchao Liu, Lingyong Yan, Hongyu Lin, Xianpei Han, Le Sun 0001. 4683-4693 [doi]

AdaTag: Multi-Attribute Value Extraction from Product Profiles with Adaptive DecodingJun Yan, Nasser Zalmout, Yan Liang, Christan Grant, Xiang Ren, Xin Luna Dong. 4694-4705 [doi]

CoRI: Collective Relation Integration with Data Augmentation for Open Information ExtractionZhengbao Jiang, Jialong Han, Bunyamin Sisman, Xin Luna Dong. 4706-4716 [doi]

Benchmarking Scalable Methods for Streaming Cross Document Entity CoreferenceRobert L. Logan IV, Andrew McCallum, Sameer Singh 0001, Daniel M. Bikel. 4717-4731 [doi]

Search from History and Reason for Future: Two-stage Reasoning on Temporal Knowledge GraphsZixuan Li, Xiaolong Jin, Saiping Guan, Wei Li, Jiafeng Guo, Yuanzhuo Wang, Xueqi Cheng. 4732-4743 [doi]

Employing Argumentation Knowledge Graphs for Neural Argument GenerationKhalid Al Khatib, Lukas Trautner, Henning Wachsmuth, Yufang Hou 0001, Benno Stein 0001. 4744-4754 [doi]

Learning Span-Level Interactions for Aspect Sentiment Triplet ExtractionLu Xu, Yew Ken Chia, Lidong Bing. 4755-4766 [doi]

On Compositional Generalization of Neural Machine TranslationYafu Li, Yongjing Yin, Yulong Chen, Yue Zhang. 4767-4780 [doi]

Mask-Align: Self-Supervised Neural Word AlignmentChi Chen, Maosong Sun, Yang Liu 0005. 4781-4791 [doi]

GWLAN: General Word-Level AutocompletioN for Computer-Aided TranslationHuayang Li, Lemao Liu, Guoping Huang, Shuming Shi 0001. 4792-4802 [doi]

De-biasing Distantly Supervised Named Entity Recognition via Causal InterventionWenkai Zhang, Hongyu Lin, Xianpei Han, Le Sun 0001. 4803-4813 [doi]

A Span-Based Model for Joint Overlapped and Discontinuous Named Entity RecognitionFei Li, Zhichao Lin, Meishan Zhang, Donghong Ji. 4814-4828 [doi]

MLBiNet: A Cross-Sentence Collective Event Detection NetworkDongfang Lou, Zhilin Liao, Shumin Deng, Ningyu Zhang, Huajun Chen. 4829-4839 [doi]

Exploiting Document Structures and Cluster Consistencies for Event Coreference ResolutionHieu Minh Tran, Duy Phung, Thien Huu Nguyen. 4840-4850 [doi]

StereoRel: Relational Triple Extraction from a Stereoscopic PerspectiveXuetao Tian, Liping Jing, Lu He, Feng Liu. 4851-4861 [doi]

Knowledge-Enriched Event Causality Identification via Latent Structure Induction NetworksPengfei Cao, Xinyu Zuo, Yubo Chen 0001, Kang Liu 0001, Jun Zhao 0001, Yuguang Chen, Weihua Peng. 4862-4872 [doi]

Turn the Combination Lock: Learnable Textual Backdoor Attacks via Word SubstitutionFanchao Qi, Yuan Yao, Sophia Xu, Zhiyuan Liu 0001, Maosong Sun. 4873-4883 [doi]

Parameter-Efficient Transfer Learning with Diff PruningDemi Guo, Alexander M. Rush, Yoon Kim. 4884-4896 [doi]

R2D2: Recursive Transformer based on Differentiable Tree for Interpretable Hierarchical Language ModelingXiang Hu, Haitao Mi, Zujie Wen, Yafang Wang, Yi Su, Jing Zheng, Gerard de Melo. 4897-4908 [doi]

Risk Minimization for Zero-shot Sequence LabelingZechuan Hu, Yong Jiang, Nguyen Bach, Tao Wang 0056, Zhongqiang Huang, Fei Huang, Kewei Tu. 4909-4920 [doi]

WARP: Word-level Adversarial ReProgrammingKaren Hambardzumyan, Hrant Khachatrian, Jonathan May. 4921-4933 [doi]

Lexicon Learning for Few Shot Sequence ModelingEkin Akyürek, Jacob Andreas. 4934-4946 [doi]

Personalized Transformer for Explainable RecommendationLei Li, Yongfeng Zhang, Li Chen. 4947-4957 [doi]

Generating SOAP Notes from Doctor-Patient Conversations Using Modular Summarization TechniquesKundan Krishna, Sopan Khosla, Jeffrey P. Bigham, Zachary C. Lipton. 4958-4972 [doi]

Tail-to-Tail Non-Autoregressive Sequence Prediction for Chinese Grammatical Error CorrectionPiji Li, Shuming Shi 0001. 4973-4984 [doi]

Early Detection of Sexual Predators in ChatsMatthias Vogt, Ulf Leser, Alan Akbik. 4985-4999 [doi]

Writing by Memorizing: Hierarchical Retrieval-based Medical Report GenerationXingyi Yang, Muchao Ye, Quanzeng You, Fenglong Ma. 5000-5009 [doi]

Concept-Based Label Embedding via Dynamic Routing for Hierarchical Text ClassificationXuepeng Wang, Li Zhao, Bing Liu, Tao Chen, Feng Zhang, Di Wang. 5010-5019 [doi]

VisualSparta: An Embarrassingly Simple Approach to Large-scale Text-to-Image Search with Weighted Bag-of-wordsXiaoPeng Lu, Tiancheng Zhao, Kyusong Lee. 5020-5029 [doi]

Few-Shot Text Ranking with Meta Adapted Synthetic Weak SupervisionSi Sun, Yingzhuo Qian, Zhenghao Liu, Chenyan Xiong, Kaitao Zhang, Jie Bao, Zhiyuan Liu, Paul Bennett. 5030-5043 [doi]

Semi-Supervised Text Classification with Balanced Deep Representation DistributionsChangchun Li, XiMing Li, Jihong OuYang. 5044-5053 [doi]

Improving Document Representations by Generating Pseudo Query Embeddings for Dense RetrievalHongyin Tang, Xingwu Sun, Beihong Jin, Jingang Wang, Fuzheng Zhang, Wei Wu. 5054-5064 [doi]

ConSERT: A Contrastive Framework for Self-Supervised Sentence Representation TransferYuanmeng Yan, Rumei Li, Sirui Wang, Fuzheng Zhang, Wei Wu, Weiran Xu. 5065-5075 [doi]

Exploring Dynamic Selection of Branch Expansion Orders for Code GenerationHui Jiang, Chulun Zhou, Fandong Meng, Biao Zhang 0002, Jie Zhou 0016, Degen Huang, Qingqiang Wu 0001, Jinsong Su. 5076-5085 [doi]

COINS: Dynamically Generating COntextualized Inference Rules for Narrative Story CompletionDebjit Paul, Anette Frank. 5086-5099 [doi]

Reasoning over Entity-Action-Location Graph for Procedural Text UnderstandingHao Huang, Xiubo Geng, Jian Pei, Guodong Long, Daxin Jiang. 5100-5109 [doi]

From Paraphrasing to Semantic Parsing: Unsupervised Semantic Parsing via Synchronous Semantic DecodingShan Wu, Bo Chen 0020, Chunlei Xin, Xianpei Han, Le Sun 0001, Weipeng Zhang, Jiansong Chen, Fan Yang, Xunliang Cai. 5110-5121 [doi]

Pre-training Universal Language RepresentationYian Li, Hai Zhao. 5122-5133 [doi]

Structural Pre-training for Dialogue ComprehensionZhuosheng Zhang 0001, Hai Zhao. 5134-5145 [doi]

AutoTinyBERT: Automatic Hyper-parameter Optimization for Efficient Pre-trained Language ModelsYichun Yin, Cheng Chen, Lifeng Shang, Xin Jiang, Xiao Chen, Qun Liu. 5146-5157 [doi]

Data Augmentation with Adversarial Training for Cross-Lingual NLIXin Dong 0010, Yaxin Zhu, Zuohui Fu, Dongkuan Xu, Gerard de Melo. 5158-5167 [doi]

Bootstrapped Unsupervised Sentence Representation LearningYan Zhang 0004, Ruidan He, Zuozhu Liu, Lidong Bing, Haizhou Li 0001. 5168-5180 [doi]

Learning Event Graph Knowledge for Abductive ReasoningLi Du, Xiao Ding, Ting Liu 0001, Bing Qin 0001. 5181-5190 [doi]

A Cognitive Regularizer for Language ModelingJason Wei, Clara Meister, Ryan Cotterell. 5191-5202 [doi]

Lower Perplexity is Not Always Human-LikeTatsuki Kuribayashi, Yohei Oseki, Takumi Ito, Ryo Yoshida, Masayuki Asahara, Kentaro Inui. 5203-5217 [doi]

Word Sense Disambiguation: Towards Interactive Context Exploitation from Both Word and Sense PerspectivesMing Wang, Yinglin Wang. 5218-5229 [doi]

A Knowledge-Guided Framework for Frame IdentificationXuefeng Su, Ru Li, Xiaoli Li, Jeff Z. Pan, Hu Zhang, Qinghua Chai, Xiaoqi Han. 5230-5240 [doi]

Obtaining Better Static Word Embeddings Using Contextual Embedding ModelsPrakhar Gupta, Martin Jaggi. 5241-5253 [doi]

Meta-Learning with Variational Semantic Memory for Word Sense DisambiguationYing-jun Du, Nithin Holla, Xiantong Zhen, Cees Snoek, Ekaterina Shutova. 5254-5268 [doi]

LexFit: Lexical Fine-Tuning of Pretrained Language ModelsIvan Vulic, Edoardo Maria Ponti, Anna Korhonen, Goran Glavas. 5269-5283 [doi]

Text-Free Image-to-Speech Synthesis Using Learned Segmental UnitsWei-Ning Hsu, David Harwath, Tyler Miller, Christopher Song, James R. Glass. 5284-5300 [doi]

CTFN: Hierarchical Learning for Multimodal Sentiment Analysis Using Coupled-Translation Fusion NetworkJiajia Tang, Kang Li, Xuanyu Jin, Andrzej Cichocki, Qibin Zhao, Wanzeng Kong. 5301-5311 [doi]

Positional Artefacts Propagate Through Masked Language Model EmbeddingsZiyang Luo, Artur Kulmizev, Xiaoxi Mao. 5312-5327 [doi]

Language Model Evaluation Beyond PerplexityClara Meister, Ryan Cotterell. 5328-5339 [doi]

Learning to Explain: Generating Stable Explanations FastXuelin Situ, Ingrid Zukerman, Cécile Paris, Sameen Maruf, Gholamreza Haffari. 5340-5355 [doi]

StereoSet: Measuring stereotypical bias in pretrained language modelsMoin Nadeem, Anna Bethke, Siva Reddy. 5356-5371 [doi]

Alignment Rationale for Natural Language InferenceZhongtao Jiang, Yuanzhe Zhang, Zhao Yang, Jun Zhao 0001, Kang Liu 0001. 5372-5387 [doi]

Enabling Lightweight Fine-tuning for Pre-trained Language Model Compression based on Matrix Product OperatorsPeiyu Liu, Ze-Feng Gao, Wayne Xin Zhao, Zhi-yuan Xie, Zhong-Yi Lu, Ji-Rong Wen. 5388-5398 [doi]

On Sample Based Explanation Methods for NLP: Faithfulness, Efficiency and Semantic EvaluationWei Zhang, Ziming Huang, Yada Zhu, Guangnan Ye, Xiaodong Cui, Fan Zhang. 5399-5411 [doi]

Syntax-Enhanced Pre-trained ModelZenan Xu, Daya Guo, Duyu Tang, Qinliang Su, Linjun Shou, Ming Gong, Wanjun Zhong, Xiaojun Quan, Daxin Jiang, Nan Duan. 5412-5422 [doi]

Matching Distributions between Model and Data: Cross-domain Knowledge Distillation for Unsupervised Domain AdaptationBo Zhang, Xiaoming Zhang, Yun Liu, Lei Cheng, Zhoujun Li. 5423-5433 [doi]

Counterfactual Inference for Text Classification DebiasingChen Qian 0003, Fuli Feng, Lijie Wen, Chunping Ma, Pengjun Xie. 5434-5445 [doi]

HieRec: Hierarchical User Interest Modeling for Personalized News RecommendationTao Qi, Fangzhao Wu, Chuhan Wu, Peiru Yang, Yang Yu, Xing Xie 0001, Yongfeng Huang 0001. 5446-5456 [doi]

PP-Rec: News Recommendation with Personalized User Interest and Time-aware News PopularityTao Qi, Fangzhao Wu, Chuhan Wu, Yongfeng Huang 0001. 5457-5467 [doi]

Article Reranking by Memory-Enhanced Key Sentence Matching for Detecting Previously Fact-Checked ClaimsQiang Sheng, Juan Cao, Xueyao Zhang, Xirong Li, Lei Zhong. 5468-5481 [doi]

Defense against Synonym Substitution-based Adversarial Attacks via Dirichlet Neighborhood EnsembleYi Zhou, Xiaoqing Zheng, Cho-Jui Hsieh, Kai-Wei Chang, Xuanjing Huang. 5482-5492 [doi]

Shortformer: Better Language Modeling using Shorter InputsOfir Press, Noah A. Smith, Mike Lewis. 5493-5505 [doi]

BanditMTL: Bandit-based Multi-task Learning for Text ClassificationYuren Mao, Zekai Wang, Weiwei Liu, Xuemin Lin 0001, Wenbin Hu. 5506-5516 [doi]

Unified Interpretation of Softmax Cross-Entropy and Negative Sampling: With Case Study for Knowledge Graph EmbeddingHidetaka Kamigaito, Katsuhiko Hayashi. 5517-5531 [doi]

De-Confounded Variational Encoder-Decoder for Logical Table-to-Text GenerationWenqing Chen, Jidong Tian, Yitian Li, Hao He 0007, Yaohui Jin. 5532-5542 [doi]

Rethinking Stealthiness of Backdoor Attack against NLP ModelsWenkai Yang, Yankai Lin, Peng Li 0030, Jie Zhou 0016, Xu Sun 0001. 5543-5557 [doi]

Crowdsourcing Learning as Domain Adaptation: A Case Study on Named Entity RecognitionXin Zhang, Guangwei Xu, Yueheng Sun, Meishan Zhang, Pengjun Xie. 5558-5570 [doi]

Exploring Distantly-Labeled Rationales in Neural Network ModelsQuzhe Huang, Shengqi Zhu, Yansong Feng, Dongyan Zhao 0001. 5571-5582 [doi]

Learning to Perturb Word Embeddings for Out-of-distribution QASeanie Lee, Minki Kang, Juho Lee, Sung Ju Hwang. 5583-5595 [doi]

Maria: A Visual Experience Powered Conversational AgentZujie Liang, Huang Hu, Can Xu, Chongyang Tao, Xiubo Geng, Yining Chen, Fan Liang, Daxin Jiang. 5596-5611 [doi]

A Human-machine Collaborative Framework for Evaluating Malevolence in DialoguesYangjun Zhang, Pengjie Ren, Maarten de Rijke. 5612-5623 [doi]

Generating Relevant and Coherent Dialogue Responses using Self-Separated Conditional Variational AutoEncodersBin Sun, Shaoxiong Feng, Yiwei Li, Jiamou Liu, Kan Li. 5624-5637 [doi]

Learning to Ask Conversational Questions by Optimizing Levenshtein DistanceZHongkun Liu, Pengjie Ren, Zhumin Chen, Zhaochun Ren, Maarten de Rijke, Ming Zhou 0001. 5638-5650 [doi]

DVD: A Diagnostic Dataset for Multi-step Reasoning in Video Grounded DialogueHung Le, Chinnadhurai Sankar, Seungwhan Moon, Ahmad Beirami, Alborz Geramifard, Satwik Kottur. 5651-5665 [doi]

MMGCN: Multimodal Fusion via Deep Graph Convolution Network for Emotion Recognition in ConversationJingwen Hu, Yuchen Liu, Jinming Zhao, Qin Jin. 5666-5675 [doi]

DynaEval: Unifying Turn and Dialogue Level EvaluationChen Zhang, Yiming Chen, Luis Fernando D'Haro, Yan Zhang, Thomas Friedrichs, Grandee Lee, Haizhou Li 0001. 5676-5689 [doi]

CoSQA: 20, 000+ Web Queries for Code Search and Question AnsweringJunjie Huang, Duyu Tang, Linjun Shou, Ming Gong, Ke Xu 0001, Daxin Jiang, Ming Zhou 0001, Nan Duan. 5690-5700 [doi]

Rewriter-Evaluator Architecture for Neural Machine TranslationYangming Li, Kaisheng Yao. 5701-5710 [doi]

Modeling Bilingual Conversational Characteristics for Neural Chat TranslationYunlong Liang, Fandong Meng, Yufeng Chen, Jinan Xu, Jie Zhou 0016. 5711-5724 [doi]

Importance-based Neuron Allocation for Multilingual Neural Machine TranslationWanying Xie, Yang Feng 0004, Shuhao Gu, Dong Yu 0003. 5725-5737 [doi]

Transfer Learning for Sequence Generation: from Single-source to Multi-sourceXuancheng Huang, Jingfang Xu, Maosong Sun, Yang Liu 0005. 5738-5750 [doi]

A Closer Look at Few-Shot Crosslingual Transfer: The Choice of Shots MattersMengjie Zhao, Yi Zhu, Ehsan Shareghi, Ivan Vulic, Roi Reichart, Anna Korhonen, Hinrich Schütze. 5751-5767 [doi]

Coreference Reasoning in Machine Reading ComprehensionMingzhu Wu, Nafise Sadat Moosavi, Dan Roth, Iryna Gurevych. 5768-5781 [doi]

Adapting Unsupervised Syntactic Parsing Methodology for Discourse Dependency ParsingLiwen Zhang, Ge Wang 0005, Wenjuan Han, Kewei Tu. 5782-5794 [doi]

A Conditional Splitting Framework for Efficient Constituency ParsingThanh Tung Nguyen, Xuan-Phi Nguyen, Shafiq R. Joty, Xiaoli Li 0001. 5795-5807 [doi]

A Unified Generative Framework for Various NER SubtasksHang Yan, Tao Gui, Junqi Dai, Qipeng Guo, Zheng Zhang, Xipeng Qiu. 5808-5822 [doi]

An In-depth Study on Internal Structure of Chinese WordsChen Gong, Saihao Huang, Houquan Zhou, Zhenghua Li, Min Zhang, Zhefeng Wang, Baoxing Huai, Nicholas Jing Yuan. 5823-5833 [doi]

MulDA: A Multilingual Data Augmentation Framework for Low-Resource Cross-Lingual NERLinlin Liu, Bosheng Ding, Lidong Bing, Shafiq R. Joty, Luo Si, Chunyan Miao. 5834-5846 [doi]

Lexicon Enhanced Chinese Sequence Labeling Using BERT AdapterWei Liu, Xiyan Fu, Yue Zhang, Wenming Xiao. 5847-5858 [doi]

Math Word Problem Solving with Explicit Numerical ValuesQinzhuo Wu, Qi Zhang, Zhongyu Wei, Xuanjing Huang. 5859-5869 [doi]

Neural-Symbolic Solver for Math Word Problems with Auxiliary TasksJinghui Qin, Xiaodan Liang, Yining Hong, Jianheng Tang, Liang Lin. 5870-5881 [doi]

SMedBERT: A Knowledge-Enhanced Pre-trained Language Model with Structured Semantics for Medical Text MiningTaolin Zhang, Zerui Cai, Chengyu Wang 0001, Minghui Qiu, Bite Yang, Xiaofeng He. 5882-5893 [doi]

What is Your Article Based On? Inferring Fine-grained ProvenanceYi Zhang, Zachary G. Ives, Dan Roth. 5894-5903 [doi]

Cross-modal Memory Networks for Radiology Report GenerationZhihong Chen, Yaling Shen, Yan Song, Xiang Wan. 5904-5914 [doi]

Controversy and Conformity: from Generalized to Personalized Aggressiveness DetectionKamil Kanclerz, Alicja Figas, Marcin Gruza, Tomasz Kajdanowicz, Jan Kocon, Daria Puchalska, Przemyslaw Kazienko. 5915-5926 [doi]

Multi-perspective Coherent Reasoning for Helpfulness Prediction of Multimodal ReviewsJunhao Liu, Zhen Hai, Min Yang 0007, Lidong Bing. 5927-5936 [doi]

Instantaneous Grammatical Error Correction with Shallow Aggressive DecodingXin Sun, Tao Ge, Furu Wei, Houfeng Wang. 5937-5947 [doi]

Automatic ICD Coding via Interactive Shared Representation Networks with Self-distillation MechanismTong Zhou, Pengfei Cao, Yubo Chen 0001, Kang Liu 0001, Jun Zhao 0001, Kun Niu, Weifeng Chong, Shengping Liu. 5948-5957 [doi]

PHMOSpell: Phonological and Morphological Knowledge Guided Chinese Spelling CheckLi Huang, Junjie Li, WeiWei Jiang, Zhiyu Zhang, Minchuan Chen, Shaojun Wang, Jing Xiao. 5958-5967 [doi]

Guiding the Growth: Difficulty-Controllable Question Generation through Step-by-Step RewritingYi Cheng, Siyao Li, Bang Liu, Ruihui Zhao, Sujian Li, Chenghua Lin, Yefeng Zheng. 5968-5978 [doi]

Improving Encoder by Auxiliary Supervision Tasks for Table-to-Text GenerationLiang Li, Can Ma, Yinliang Yue, Dayong Hu. 5979-5989 [doi]

POS-Constrained Parallel Decoding for Non-autoregressive GenerationKexin Yang, Wenqiang Lei, Dayiheng Liu, Weizhen Qi, Jiancheng Lv. 5990-6000 [doi]

Bridging Subword Gaps in Pretrain-Finetune Paradigm for Natural Language GenerationXin Liu 0066, Baosong Yang, Dayiheng Liu, Haibo Zhang, Weihua Luo, Min Zhang, Haiying Zhang, Jinsong Su. 6001-6011 [doi]

TGEA: An Error-Annotated Dataset and Benchmark Tasks for TextGeneration from Pretrained Language ModelsJie He, Bo Peng, Yi Liao, Qun Liu, Deyi Xiong. 6012-6025 [doi]

Long-Span Summarization via Local Attention and Content SelectionPotsawee Manakul, Mark J. F. Gales. 6026-6041 [doi]

RepSum: Unsupervised Dialogue Summarization based on Replacement StrategyXiyan Fu, Yating Zhang, Tianyi Wang, Xiaozhong Liu, Changlong Sun, Zhenglu Yang. 6042-6051 [doi]

BASS: Boosting Abstractive Summarization with Unified Semantic GraphWenhao Wu, Wei Li, Xinyan Xiao, Jiachen Liu, Ziqiang Cao, Sujian Li, Hua Wu 0003, Haifeng Wang 0001. 6052-6067 [doi]

Capturing Relations between Scientific Papers: An Abstractive Model for Related Work Section GenerationXiuying Chen, Hind Alamro, Mingzhe Li, Shen Gao, Xiangliang Zhang 0001, Dongyan Zhao 0001, Rui Yan 0001. 6068-6077 [doi]

Focus Attention: Promoting Faithfulness and Diversity in SummarizationRahul Aralikatte, Shashi Narayan, Joshua Maynez, Sascha Rothe, Ryan T. McDonald. 6078-6095 [doi]

Generating Query Focused Summaries from Query-Free ResourcesYumo Xu, Mirella Lapata. 6096-6109 [doi]

Robustifying Multi-hop QA through Pseudo-Evidentiality TrainingKyungjae Lee, Seung-won Hwang, Sang-Eun Han, Dohyeon Lee. 6110-6119 [doi]

xMoCo: Cross Momentum Contrastive Learning for Open-Domain Question AnsweringNan Yang, Furu Wei, Binxing Jiao, Daxing Jiang, Linjun Yang. 6120-6129 [doi]

Learn to Resolve Conversational Dependency: A Consistency Training Framework for Conversational Question AnsweringGangwoo Kim, Hyunjae Kim, Jungsoo Park, Jaewoo Kang. 6130-6141 [doi]

PhotoChat: A Human-Human Dialogue Dataset With Photo Sharing Behavior For Joint Image-Text ModelingXiaoxue Zang, Lijuan Liu, Maria Wang, Yang Song, Hao Zhang, Jindong Chen. 6142-6152 [doi]

Good for Misconceived Reasons: An Empirical Revisiting on the Need for Visual Context in Multimodal Machine TranslationZhiyong Wu, Lingpeng Kong, Wei Bi, Xiang Li, Ben Kao. 6153-6166 [doi]

Attend What You Need: Motion-Appearance Synergistic Networks for Video Question AnsweringAhjeong Seo, Gi-Cheon Kang, Joonhan Park, Byoung-Tak Zhang. 6167-6177 [doi]

BERTifying the Hidden Markov Model for Multi-Source Weakly Supervised Named Entity RecognitionYinghao Li, Pranav Shetty, Lucas Liu, Chao Zhang, Le Song. 6178-6190 [doi]

CIL: Contrastive Instance Learning Framework for Distantly Supervised Relation ExtractionTao Chen, Haizhou Shi, Siliang Tang, Zhigang Chen 0003, Fei Wu 0001, Yueting Zhuang. 6191-6200 [doi]

SENT: Sentence-level Distant Relation Extraction via Negative TrainingRuotian Ma, Tao Gui, Linyang Li, Qi Zhang, Xuanjing Huang, Yaqian Zhou. 6201-6213 [doi]

An End-to-End Progressive Multi-Task Learning Framework for Medical Named Entity Recognition and NormalizationBaohang Zhou, Xiangrui Cai, Ying Zhang 0015, Xiaojie Yuan. 6214-6224 [doi]

PRGC: Potential Relation and Global Correspondence Based Joint Relational Triple ExtractionHengyi Zheng, Rui Wen, Xi Chen, Yifan Yang, Yunyan Zhang, Ziheng Zhang, Ningyu Zhang, Bin Qin, Xu Ming, Yefeng Zheng. 6225-6235 [doi]

Learning from Miscellaneous Other-Class Words for Few-shot Named Entity RecognitionMeihan Tong, Shuai Wang, Bin Xu, Yixin Cao 0002, Minghui Liu, Lei Hou 0001, Juanzi Li. 6236-6247 [doi]

Joint Biomedical Entity and Relation Extraction with Knowledge-Enhanced Collective InferenceTuan Lai, Heng Ji, ChengXiang Zhai, Quan Hung Tran. 6248-6260 [doi]

Fine-grained Information Extraction from Biomedical Literature based on Knowledge-enriched Abstract Meaning RepresentationZixuan Zhang, Nikolaus Nova Parulian, Heng Ji, Ahmed ElSayed, Skatje Myers, Martha Palmer. 6261-6270 [doi]

Unleash GPT-2 Power for Event DetectionAmir Pouran Ben Veyseh, Viet Lai, Franck Dernoncourt, Thien Huu Nguyen. 6271-6282 [doi]

CLEVE: Contrastive Pre-training for Event ExtractionZiqi Wang, Xiaozhi Wang, Xu Han 0007, Yankai Lin, Lei Hou 0001, Zhiyuan Liu 0001, Peng Li 0030, Juanzi Li, Jie Zhou 0016. 6283-6297 [doi]

Document-level Event Extraction via Parallel Prediction NetworksHang Yang, Dianbo Sui, Yubo Chen 0001, Kang Liu 0001, Jun Zhao 0001, Taifeng Wang. 6298-6308 [doi]

StructuralLM: Structural Pre-training for Form UnderstandingChenliang Li, Bin Bi, Ming Yan, Wei Wang 0225, Songfang Huang, Fei Huang, Luo Si. 6309-6318 [doi]

Dual Graph Convolutional Networks for Aspect-based Sentiment AnalysisRuifan Li, Hao Chen, Fangxiang Feng, Zhanyu Ma, Xiaojie Wang, Eduard H. Hovy. 6319-6329 [doi]

Multi-Label Few-Shot Learning for Aspect Category DetectionMengting Hu, Shiwan Zhao, Honglei Guo, Chao Xue, Hang Gao, Tiegang Gao, Renhong Cheng, Zhong Su. 6330-6340 [doi]

Argument Pair Extraction via Attention-guided Multi-Layer Multi-Cross EncodingLiYing Cheng, Tianyu Wu, Lidong Bing, Luo Si. 6341-6353 [doi]

A Neural Transition-based Model for Argumentation MiningJianzhu Bao, Chuang Fan, Jipeng Wu, Yixue Dang, Jiachen Du, Ruifeng Xu. 6354-6364 [doi]

Keep It Simple: Unsupervised Simplification of Multi-Paragraph TextPhilippe Laban, Tobias Schnabel, Paul Bennett, Marti A. Hearst. 6365-6378 [doi]

Long Text Generation by Modeling Sentence-Level and Discourse-Level CoherenceJian Guan, Xiaoxi Mao, Changjie Fan, Zitao Liu, Wenbiao Ding, Minlie Huang. 6379-6393 [doi]

OpenMEVA: A Benchmark for Evaluating Open-ended Story Generation MetricsJian Guan, Zhexin Zhang, Zhuoer Feng, Zitao Liu, Wenbiao Ding, Xiaoxi Mao, Changjie Fan, Minlie Huang. 6394-6407 [doi]

DYPLOC: Dynamic Planning of Content Using Mixed Language Models for Text GenerationXinyu Hua, Ashwin Sreevatsa, Lu Wang 0008. 6408-6423 [doi]

Controllable Open-ended Question Generation with A New Question Type OntologyShuyang Cao, Lu Wang 0008. 6424-6439 [doi]

BERTGen: Multi-task Generation through BERTFaidon Mitzalis, Ozan Caglayan, Pranava Madhyastha, Lucia Specia. 6440-6455 [doi]

Selective Knowledge Distillation for Neural Machine TranslationFusheng Wang 0008, Jianhao Yan, Fandong Meng, Jie Zhou 0016. 6456-6466 [doi]

Measuring and Increasing Context Usage in Context-Aware Machine TranslationPatrick Fernandes, Kayo Yin, Graham Neubig, André F. T. Martins. 6467-6478 [doi]

Beyond Offline Mapping: Learning Cross-lingual Word Embeddings through Context AnchoringAitor Ormazabal, Mikel Artetxe, Aitor Soroa, Gorka Labaka, Eneko Agirre. 6479-6489 [doi]

CCMatrix: Mining Billions of High-Quality Parallel Sentences on the WebHolger Schwenk, Guillaume Wenzek, Sergey Edunov, Edouard Grave, Armand Joulin, Angela Fan. 6490-6500 [doi]

Length-Adaptive Transformer: Train Once with Length Drop, Use Anytime with SearchGyuwan Kim, KyungHyun Cho. 6501-6511 [doi]

GhostBERT: Generate More Features with Cheap Operations for BERTZhiqi Huang, Lu Hou, Lifeng Shang, Xin Jiang, Xiao Chen, Qun Liu. 6512-6523 [doi]

Super Tickets in Pre-Trained Language Models: From Model Compression to Improving GeneralizationChen Liang, Simiao Zuo, Minshuo Chen, Haoming Jiang, Xiaodong Liu, Pengcheng He, Tuo Zhao, Weizhu Chen. 6524-6538 [doi]

A Novel Estimator of Mutual Information for Learning to Disentangle Textual RepresentationsPierre Colombo, Pablo Piantanida, Chloé Clavel. 6539-6550 [doi]

Determinantal Beam SearchClara Meister, Martina Forster, Ryan Cotterell. 6551-6562 [doi]

Multi-hop Graph Convolutional Network with High-order Chebyshev Approximation for Text ReasoningShuoran Jiang, Qingcai Chen, Xin Liu, Baotian Hu, Lisai Zhang. 6563-6573 [doi]

Accelerating Text Communication via Abbreviated Sentence InputJiban Adhikary, Jamie Berger, Keith Vertanen. 6574-6588 [doi]

Regression Bugs Are In Your Model! Measuring, Reducing and Analyzing Regressions In NLP Model UpdatesYuqing Xie, Yi-An Lai, Yuanjun Xiong, Yi Zhang, Stefano Soatto. 6589-6602 [doi]

Detecting Propaganda Techniques in MemesDimitar Dimitrov, Bishr Bin Ali, Shaden Shaar, Firoj Alam, Fabrizio Silvestri, Hamed Firooz, Preslav Nakov, Giovanni Da San Martino. 6603-6617 [doi]

On the Efficacy of Adversarial Data Collection for Question Answering: Results from a Large-Scale Randomized StudyDivyansh Kaushik, Douwe Kiela, Zachary C. Lipton, Wen-tau Yih. 6618-6633 [doi]

Learning Dense Representations of Phrases at ScaleJinhyuk Lee, Mujeen Sung, Jaewoo Kang, Danqi Chen. 6634-6647 [doi]

End-to-End Training of Neural Retrievers for Open-Domain Question AnsweringDevendra Singh Sachan, Mostofa Patwary, Mohammad Shoeybi, Neel Kant, Wei Ping, William L. Hamilton, Bryan Catanzaro. 6648-6662 [doi]

Question Answering Over Temporal Knowledge GraphsApoorv Saxena, Soumen Chakrabarti, Partha Talukdar. 6663-6676 [doi]

Language Model Augmented Relevance ScoreRuibo Liu, Jason Wei, Soroush Vosoughi. 6677-6690 [doi]

DExperts: Decoding-Time Controlled Text Generation with Experts and Anti-ExpertsAlisa Liu, Maarten Sap, Ximing Lu, Swabha Swayamdipta, Chandra Bhagavatula, Noah A. Smith, Yejin Choi. 6691-6706 [doi]

Polyjuice: Generating Counterfactuals for Explaining, Evaluating, and Improving ModelsTongshuang Wu, Marco Túlio Ribeiro, Jeffrey Heer, Daniel S. Weld. 6707-6723 [doi]

Metaphor Generation with Conceptual MappingsKevin Stowe, Tuhin Chakrabarty, Nanyun Peng, Smaranda Muresan, Iryna Gurevych. 6724-6736 [doi]

Learning Latent Structures for Cross Action Phrase Relations in Wet Lab ProtocolsChaitanya Kulkarni, Jany Chan, Eric Fosler-Lussier, Raghu Machiraju. 6737-6750 [doi]

Multimodal Multi-Speaker Merger & Acquisition Financial Modeling: A New Task, Dataset, and Neural BaselinesRamit Sawhney, Mihir Goyal, Prakhar Goel, Puneet Mathur, Rajiv Ratn Shah. 6751-6762 [doi]

Mid-Air Hand Gestures for Post-Editing of Machine TranslationRashad Albo Jamara, Nico Herbig 0001, Antonio Krüger, Josef van Genabith. 6763-6773 [doi]

Inter-GPS: Interpretable Geometry Problem Solving with Formal Language and Symbolic ReasoningPan Lu, Ran Gong, Shibiao Jiang, Liang Qiu, Siyuan Huang, Xiaodan Liang, Song Chun Zhu. 6774-6786 [doi]

Joint Verification and Reranking for Open Fact Checking Over TablesMichael Sejr Schlichtkrull, Vladimir Karpukhin, Barlas Oguz, Mike Lewis, Wen-tau Yih, Sebastian Riedel 0001. 6787-6799 [doi]

Evaluation of Thematic Coherence in MicroblogsIman Munire Bilal, Bo Wang 0034, Maria Liakata, Rob Procter, Adam Tsakalidis. 6800-6814 [doi]

Neural semi-Markov CRF for Monolingual Word AlignmentWuwei Lan, Chao Jiang, Wei Xu. 6815-6828 [doi]

Privacy at Scale: Introducing the PrivaSeer Corpus of Web Privacy PoliciesMukund Srinath, Shomir Wilson, C. Lee Giles. 6829-6839 [doi]

The statistical advantage of automatic NLG metrics at the system levelJohnny Tian-Zheng Wei, Robin Jia. 6840-6854 [doi]

Are Missing Links Predictable? An Inferential Benchmark for Knowledge Graph CompletionYixin Cao 0002, Xiang Ji, Xin Lv, Juanzi Li, Yonggang Wen 0001, Hanwang Zhang. 6855-6865 [doi]

ConvoSumm: Conversation Summarization Benchmark and Improved Abstractive Summarization with Argument MiningAlexander R. Fabbri, Faiaz Rahman, Imad Rizvi, Borui Wang, Haoran Li, Yashar Mehdad, Dragomir R. Radev. 6866-6880 [doi]

Improving Factual Consistency of Abstractive Summarization via Question AnsweringFeng Nan, Cícero Nogueira dos Santos, Henghui Zhu, Patrick Ng, Kathleen R. McKeown, Ramesh Nallapati, Dejiao Zhang, Zhiguo Wang, Andrew O. Arnold, Bing Xiang. 6881-6894 [doi]

EmailSum: Abstractive Email Thread SummarizationShiyue Zhang, Asli Celikyilmaz, Jianfeng Gao, Mohit Bansal. 6895-6909 [doi]

Cross-Lingual Abstractive Summarization with Limited Parallel ResourcesYu Bai, Yang Gao 0016, Heyan Huang. 6910-6924 [doi]

Dissecting Generation Modes for Abstractive Summarization Models via Ablation and AttributionJiacheng Xu, Greg Durrett. 6925-6940 [doi]

Learning Prototypical Functions for Physical ArtifactsTianyu Jiang, Ellen Riloff. 6941-6951 [doi]

Verb Knowledge Injection for Multilingual Event ProcessingOlga Majewska, Ivan Vulic, Goran Glavas, Edoardo Maria Ponti, Anna Korhonen. 6952-6969 [doi]

Dynamic Contextualized Word EmbeddingsValentin Hofmann, Janet B. Pierrehumbert, Hinrich Schütze. 6970-6984 [doi]

Lexical Semantic Change DiscoverySinan Kurtyigit, Maike Park, Dominik Schlechtweg, Jonas Kuhn, Sabine Schulte im Walde. 6985-6998 [doi]

The R-U-A-Robot Dataset: Helping Avoid Chatbot Deception by Detecting User Questions About Human or Non-Human IdentityDavid Gros, Yu Li, Zhou Yu. 6999-7013 [doi]

Using Meta-Knowledge Mined from Identifiers to Improve Intent Recognition in Conversational SystemsClaudio S. Pinhanez, Paulo Rodrigo Cavalin, Victor Henrique Alves Ribeiro, Ana Paula Appel, Heloisa Candello, Julio Nogima, Mauro Pichiliani, Melina Alberio Guerra, Maíra de Bayser, Gabriel Louzada Malfatti, Henrique Ferreira. 7014-7027 [doi]

Space Efficient Context Encoding for Non-Task-Oriented Dialogue Generation with Graph Attention TransformerFabian Galetzka, Jewgeni Rose, David Schlangen, Jens Lehmann 0001. 7028-7041 [doi]

DialogueCRN: Contextual Reasoning Networks for Emotion Recognition in ConversationsDou Hu, Lingwei Wei, Xiaoyong Huai. 7042-7052 [doi]

Cross-replication Reliability - An Empirical Approach to Interpreting Inter-rater ReliabilityKa Wong, Praveen Paritosh, Lora Aroyo. 7053-7065 [doi]

TIMEDIAL: Temporal Commonsense Reasoning in DialogLianhui Qin, Aditya Gupta, Shyam Upadhyay, Luheng He, Yejin Choi, Manaal Faruqui. 7066-7076 [doi]

RAW-C: Relatedness of Ambiguous Words in Context (A New Lexical Resource for English)Sean Trott, Benjamin Bergen. 7077-7087 [doi]

ARBERT & MARBERT: Deep Bidirectional Transformers for ArabicMuhammad Abdul-Mageed, AbdelRahim A. Elmadany, El Moatez Billah Nagoudi. 7088-7105 [doi]

Improving Paraphrase Detection with the Adversarial Paraphrasing TaskAnimesh Nighojkar, John Licato. 7106-7116 [doi]

ADEPT: An Adjective-Dependent Plausibility TaskAli Emami, Ian Porada, Alexandra Olteanu, Kaheer Suleman, Adam Trischler, Jackie Chi Kit Cheung. 7117-7128 [doi]

ReadOnce Transformers: Reusable Representations of Text for TransformersShih-Ting Lin, Ashish Sabharwal, Tushar Khot. 7129-7141 [doi]

Conditional Generation of Temporally-ordered Event SequencesShih-Ting Lin, Nathanael Chambers, Greg Durrett. 7142-7157 [doi]

Hate Speech Detection Based on Sentiment Knowledge SharingXianbing Zhou, Yang Yong, Xiaochao Fan, Ge Ren, Yunfeng Song, Yufeng Diao, Liang Yang 0003, Hongfei Lin. 7158-7166 [doi]

Transition-based Bubble Parsing: Improvements on Coordination Structure PredictionTianze Shi, Lillian Lee. 7167-7182 [doi]

SpanNER: Named Entity Re-/Recognition as Span PredictionJinLan Fu, Xuanjing Huang, Pengfei Liu. 7183-7195 [doi]

StructFormer: Joint Unsupervised Induction of Dependency and Constituency Structure from Masked Language ModelingYikang Shen, Yi Tay, Che Zheng, Dara Bahri, Donald Metzler, Aaron Courville. 7196-7209 [doi]

Language Embeddings for Typology and Cross-lingual Transfer LearningDian Yu, Taiqi He, Kenji Sagae. 7210-7225 [doi]

Can Sequence-to-Sequence Models Crack Substitution Ciphers?Nada Aldarrab, Jonathan May. 7226-7235 [doi]

Beyond Noise: Mitigating the Impact of Fine-grained Semantic Divergences on Neural Machine TranslationEleftheria Briakou, Marine Carpuat. 7236-7249 [doi]

Discriminative Reranking for Neural Machine TranslationAnn Lee 0001, Michael Auli, Marc'Aurelio Ranzato. 7250-7264 [doi]

Mind Your Outliers! Investigating the Negative Impact of Outliers on Active Learning for Visual Question AnsweringSiddharth Karamcheti, Ranjay Krishna, Li Fei-Fei 0001, Christopher D. Manning. 7265-7281 [doi]

All That's 'Human' Is Not Gold: Evaluating Human Evaluation of Generated TextElizabeth Clark, Tal August, Sofia Serrano, Nikita Haduong, Suchin Gururangan, Noah A. Smith. 7282-7296 [doi]

Scientific Credibility of Machine Translation Research: A Meta-Evaluation of 769 PapersBenjamin Marie, Atsushi Fujita, Raphael Rubino. 7297-7306 [doi]

Neural Machine Translation with Monolingual Translation MemoryDeng Cai 0002, Yan Wang 0060, Huayang Li, Wai Lam, Lemao Liu. 7307-7318 [doi]

Intrinsic Dimensionality Explains the Effectiveness of Language Model Fine-TuningArmen Aghajanyan, Sonal Gupta, Luke Zettlemoyer. 7319-7328 [doi]

UnNatural Language InferenceKoustuv Sinha, Prasanna Parthasarathi, Joelle Pineau, Adina Williams. 7329-7346 [doi]

Including Signed Languages in Natural Language ProcessingKayo Yin, Amit Moryossef, Julie Hochgesang, Yoav Goldberg, Malihe Alikhani. 7347-7360 [doi]

Vocabulary Learning via Optimal Transport for Neural Machine TranslationJingjing Xu, Hao Zhou, Chun Gan, Zaixiang Zheng, Lei Li. 7361-7373 [doi]

runs on WebDSL