Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing, EMNLP 2023, Singapore, December 6-10, 2023

researchr

You are not signed in
Sign in
Sign up

Houda Bouamor, Juan Pino 0001, Kalika Bali, editors, Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing, EMNLP 2023, Singapore, December 6-10, 2023. Association for Computational Linguistics, 2023. [doi]

Conference: emnlp2023

Abstract is missing.

Frontmatter [doi]

IAG: Induction-Augmented Generation Framework for Answering Reasoning QuestionsZhebin Zhang, Xinyu Zhang, Yuanhang Ren, Saijiang Shi, Meng Han, Yongkang Wu, Ruofei Lai, Zhao Cao. 1-14 [doi]

Absolute Position Embedding Learns Sinusoid-like Waves for Attention Based on Relative PositionYuji Yamamoto, Takuya Matsuzaki. 15-28 [doi]

Chinese Lexical Substitution: Dataset and MethodJipeng Qiang, Kang Liu, Ying Li, Yun Li, Yi Zhu, Yun-Hao Yuan, Xiaocheng Hu, Xiaoye Ouyang. 29-42 [doi]

Decoding the Silent Majority: Inducing Belief Augmented Social Graph with Large Language Model for Response ForecastingChenkai Sun, Jinning Li, Yi Ren Fung 0001, Hou Pong Chan, Tarek F. Abdelzaher, ChengXiang Zhai, Heng Ji. 43-57 [doi]

Fine-grained Conversational Decoding via Isotropic and Proximal SearchYuxuan Yao, Han Wu 0004, Qiling Xu, Linqi Song. 58-70 [doi]

Holistic Inter-Annotator Agreement and Corpus Coherence Estimation in a Large-scale Multilingual Annotation CampaignNicolas Stefanovitch, Jakub Piskorski. 71-86 [doi]

PHD: Pixel-Based Language Modeling of Historical DocumentsNadav Borenstein, Phillip Rust, Desmond Elliott, Isabelle Augenstein. 87-107 [doi]

Primacy Effect of ChatGPTYiwei Wang, Yujun Cai, Muhao Chen, Yuxuan Liang, Bryan Hooi. 108-115 [doi]

Evaluating the Rationale Understanding of Critical Reasoning in Logical Reading ComprehensionAkira Kawabata, Saku Sugawara. 116-143 [doi]

Evaluating and Modeling Attribution for Cross-Lingual Question AnsweringBenjamin Muller, John Wieting, Jonathan H. Clark, Tom Kwiatkowski, Sebastian Ruder, Livio Soares, Roee Aharoni, Jonathan Herzig, Xinyi Wang. 144-157 [doi]

Better Quality Pre-training Data and T5 Models for African LanguagesAkintunde Oladipo, Mofetoluwa Adeyemi, Orevaoghene Ahia, Abraham Toluwase Owodunni, Odunayo Ogundepo, David Ifeoluwa Adelani, Jimmy Lin. 158-168 [doi]

Sparse Universal TransformerShawn Tan, Yikang Shen, Zhenfang Chen, Aaron C. Courville, Chuang Gan. 169-179 [doi]

Theory of Mind for Multi-Agent Collaboration via Large Language ModelsHuao Li, Yu Quan Chong, Simon Stepputtis, Joseph Campbell, Dana T. Hughes, Charles Lewis, Katia P. Sycara. 180-192 [doi]

Establishing Trustworthiness: Rethinking Tasks and Model EvaluationRobert Litschko, Max Müller-Eberstein, Rob van der Goot, Leon Weber-Genzel, Barbara Plank. 193-203 [doi]

Let's Think Frame by Frame with VIP: A Video Infilling and Prediction Dataset for Evaluating Video Chain-of-ThoughtVaishnavi Himakunthala, Andy Ouyang, Daniel Rose, Ryan He, Alex Mei, Yujie Lu, Chinmay Sonar, Michael Saxon, William Yang Wang. 204-219 [doi]

GPTAraEval: A Comprehensive Evaluation of ChatGPT on Arabic NLPMd Tawkat Islam Khondaker, Abdul Waheed, El Moatez Billah Nagoudi, Muhammad Abdul-Mageed. 220-247 [doi]

Dual-Channel Span for Aspect Sentiment Triplet ExtractionPan Li, Ping Li, Kai Zhang. 248-261 [doi]

Cultural Concept Adaptation on Multimodal ReasoningZhi Li, Yin Zhang. 262-276 [doi]

Understanding Compositional Data Augmentation in Typologically Diverse Morphological InflectionFarhan Samir, Miikka Silfverberg. 277-291 [doi]

Evaluating Object Hallucination in Large Vision-Language ModelsYifan Li, Yifan Du, Kun Zhou, Jinpeng Wang, Xin Zhao, Ji-Rong Wen. 292-305 [doi]

Event Ontology Completion with Hierarchical Structure Evolution NetworksPengfei Cao, Yupu Hao, Yubo Chen 0001, Kang Liu, Jiexin Xu, Huaijun Li, Xiaojian Jiang, Jun Zhao. 306-320 [doi]

Parameter-efficient Tuning for Large Language Model without Calculating Its GradientsFeihu Jin, Jiajun Zhang, Chengqing Zong. 321-330 [doi]

Discourse Structures Guided Fine-grained Propaganda IdentificationYuanyuan Lei 0001, Ruihong Huang. 331-342 [doi]

CompoundPiece: Evaluating and Improving Decompounding Performance of Language ModelsBenjamin Minixhofer, Jonas Pfeiffer, Ivan Vulic. 343-359 [doi]

Improving Image Captioning via Predicting Structured ConceptsTing Wang, Weidong Chen, Yuanhe Tian, Yan Song, Zhendong Mao. 360-370 [doi]

GATITOS: Using a New Multilingual Lexicon for Low-resource Machine TranslationAlexander Jones, Isaac Caswell, Orhan Firat, Ishank Saxena. 371-405 [doi]

Continually Improving Extractive QA via Human FeedbackGe Gao, Hung-Ting Chen, Yoav Artzi, Eunsol Choi. 406-423 [doi]

Using Interpretation Methods for Model EnhancementZhuo Chen, Chengyue Jiang, Kewei Tu. 424-438 [doi]

An Expression Tree Decoding Strategy for Mathematical Equation GenerationWenqi Zhang, Yongliang Shen 0001, Qingpeng Nong, Zeqi Tan, Yanna Ma, Weiming Lu 0001. 439-456 [doi]

Bootstrapping Small & High Performance Language Models with Unmasking-Removal Training PolicyYahan Yang, Elior Sulem, Insup Lee 0001, Dan Roth. 457-464 [doi]

Diversity Enhanced Narrative Question Generation for StorybooksHokeun Yoon, JinYeong Bak. 465-482 [doi]

Debiasing Made State-of-the-art: Revisiting the Simple Seed-based Weak Supervision for Text ClassificationChengyu Dong, Zihan Wang, Jingbo Shang. 483-493 [doi]

How to Enhance Causal Discrimination of Utterances: A Case on Affective ReasoningHang Chen, Xinyu Yang, Jing Luo 0007, Wenjing Zhu. 494-512 [doi]

Compressing and Debiasing Vision-Language Pre-Trained Models for Visual Question AnsweringQingyi Si, Yuanxin Liu, Zheng Lin 0001, Peng Fu 0008, Yanan Cao, Weiping Wang. 513-529 [doi]

Selectively Answering Ambiguous QuestionsJeremy R. Cole, Michael J. Q. Zhang, Daniel Gillick, Julian Eisenschlos, Bhuwan Dhingra, Jacob Eisenstein. 530-543 [doi]

Temporal Knowledge Graph Forecasting Without Knowledge Using In-Context LearningDong-Ho Lee, Kian Ahrabian, Woojeong Jin, Fred Morstatter, Jay Pujara. 544-557 [doi]

Knowledge Graph Compression Enhances Diverse Commonsense GenerationEunJeong Hwang, Veronika Thost, Vered Shwartz, Tengfei Ma 0001. 558-572 [doi]

Pragmatic Reasoning Unlocks Quantifier Semantics for Foundation ModelsYiyuan Li, Rakesh R. Menon, Sayan Ghosh, Shashank Srivastava. 573-591 [doi]

LLM-FP4: 4-Bit Floating-Point Quantized TransformersShih-Yang Liu, Zechun Liu, Xijie Huang, Pingcheng Dong, Kwang-Ting Cheng. 592-605 [doi]

Improving Biomedical Abstractive Summarisation with Knowledge Aggregation from Citation PapersChen Tang, Shun Wang, Tomas Goldsack, Chenghua Lin. 606-618 [doi]

Explanation Selection Using Unlabeled Data for Chain-of-Thought PromptingXi Ye, Greg Durrett. 619-637 [doi]

HalOmi: A Manually Annotated Benchmark for Multilingual Hallucination and Omission Detection in Machine TranslationDavid Dale, Elena Voita, Janice Lam, Prangthip Hansanti, Christophe Ropers, Elahe Kalbassi, Cynthia Gao, Loïc Barrault, Marta R. Costa-Jussà. 638-653 [doi]

Gradient-based Gradual Pruning for Language-Specific Multilingual Neural Machine TranslationDan He, Minh Quang Pham, Thanh-Le Ha, Marco Turchi. 654-670 [doi]

LLM-powered Data Augmentation for Enhanced Cross-lingual PerformanceChenxi Whitehouse, Monojit Choudhury, Alham Fikri Aji. 671-686 [doi]

Prompt-based Logical Semantics Enhancement for Implicit Discourse Relation RecognitionChenxu Wang, Ping Jian, Mu Huang. 687-699 [doi]

VLIS: Unimodal Language Models Guide Multimodal Language GenerationJiwan Chung, Youngjae Yu. 700-721 [doi]

Conceptual structure coheres in human cognition but not in large language modelsSiddharth Suresh, Kushin Mukherjee, Xizheng Yu, Wei-Chun Huang, Lisa Padua, Timothy T. Rogers. 722-738 [doi]

Towards LLM-driven Dialogue State TrackingYujie Feng, Zexin Lu, Bo Liu, Liming Zhan, Xiao-Ming Wu. 739-755 [doi]

Learning Language-guided Adaptive Hyper-modality Representation for Multimodal Sentiment AnalysisHaoyu Zhang, Yu Wang, Guanghao Yin, Kejun Liu, Yuanyuan Liu 0004, Tianshu Yu. 756-767 [doi]

Multitask Multimodal Prompted Training for Interactive Embodied Task CompletionGeorgios Pantazopoulos, Malvina Nikandrou, Amit Parekh, Bhathiya Hemanthage, Arash Eshghi, Ioannis Konstas, Verena Rieser, Oliver Lemon, Alessandro Suglia. 768-789 [doi]

We're Afraid Language Models Aren't Modeling AmbiguityAlisa Liu, Zhaofeng Wu, Julian Michael, Alane Suhr, Peter West, Alexander Koller, Swabha Swayamdipta, Noah A. Smith, Yejin Choi 0001. 790-807 [doi]

Linear-Time Modeling of Linguistic Structure: An Order-Theoretic PerspectiveTianyu Liu 0004, Afra Amini, Mrinmaya Sachan, Ryan Cotterell. 808-830 [doi]

GEMINI: Controlling The Sentence-Level Summary Style in Abstractive Text SummarizationGuangsheng Bao, Zebin Ou, Yue Zhang 0004. 831-842 [doi]

Fidelity-Enriched Contrastive Search: Reconciling the Faithfulness-Diversity Trade-Off in Text GenerationWei-Lin Chen, Cheng-Kuang Wu, Hsin-Hsi Chen, Chung-Chi Chen 0001. 843-851 [doi]

Analyzing Norm Violations in Live-Stream ChatJihyung Moon, Dong-Ho Lee, Hyundong Cho, Woojeong Jin, Chan Young Park, Minwoo Kim, Jonathan May, Jay Pujara, Sungjoon Park. 852-868 [doi]

Coarse-to-Fine Contrastive Learning in Image-Text-Graph Space for Improved Vision-Language CompositionalityHarman Singh, Pengchuan Zhang, Qifan Wang, Mengjiao Wang, Wenhan Xiong, Jingfei Du, Yu Chen. 869-893 [doi]

Reading Books is Great, But Not if You Are Driving! Visually Grounded Reasoning about Defeasible Commonsense NormsSeungju Han, Junhyeok Kim, Jack Hessel, Liwei Jiang, Jiwan Chung, Yejin Son, Yejin Choi 0001, Youngjae Yu. 894-914 [doi]

Enhancing Uncertainty-Based Hallucination Detection with Stronger FocusTianhang Zhang, Lin Qiu, Qipeng Guo, Cheng Deng, Yue Zhang, Zheng Zhang, Chenghu Zhou, Xinbing Wang, Luoyi Fu. 915-932 [doi]

FactKB: Generalizable Factuality Evaluation using Language Models Enhanced with Factual KnowledgeShangbin Feng, Vidhisha Balachandran, Yuyang Bai, Yulia Tsvetkov. 933-952 [doi]

Mitigating Backdoor Poisoning Attacks through the Lens of Spurious CorrelationXuanli He, Qiongkai Xu, Jun Wang, Benjamin I. P. Rubinstein, Trevor Cohn. 953-967 [doi]

Symbol tuning improves in-context learning in language modelsJerry W. Wei, Le Hou, Andrew K. Lampinen, Xiangning Chen, Da Huang, Yi Tay, Xinyun Chen, Yifeng Lu, Denny Zhou, Tengyu Ma 0001, Quoc V. Le. 968-979 [doi]

The neural dynamics of word recognition and integrationJon Gauthier, Roger Levy. 980-995 [doi]

Tree of Clarifications: Answering Ambiguous Questions with Retrieval-Augmented Large Language ModelsGangwoo Kim, Sungdong Kim, Byeongguk Jeon, Joonsuk Park, Jaewoo Kang. 996-1009 [doi]

Incorporating Worker Perspectives into MTurk Annotation Practices for NLPOlivia Huang, Eve Fleisig, Dan Klein. 1010-1028 [doi]

Predict the Future from the Past? On the Temporal Data Distribution Shift in Financial Sentiment ClassificationsYue Guo, Chenxi Hu, Yi Yang. 1029-1038 [doi]

Look-back Decoding for Open-Ended Text GenerationNan Xu, Chunting Zhou, Asli Celikyilmaz, Xuezhe Ma. 1039-1050 [doi]

Large Language Models Can Self-ImproveJiaxin Huang 0001, Shixiang Gu, Le Hou, Yuexin Wu, Xuezhi Wang 0002, Hongkun Yu 0001, Jiawei Han 0001. 1051-1068 [doi]

CodeT5+: Open Code Large Language Models for Code Understanding and GenerationYue Wang, Hung Le, Akhilesh Gotmare, Nghi D. Q. Bui, Junnan Li 0001, Steven C. H. Hoi. 1069-1088 [doi]

Structural generalization in COGS: Supertagging is (almost) all you needAlban Petit, Caio Corro, François Yvon. 1089-1101 [doi]

BioT5: Enriching Cross-modal Integration in Biology with Chemical Knowledge and Natural Language AssociationsQizhi Pei, Wei Zhang, Jinhua Zhu, Kehan Wu, Kaiyuan Gao, Lijun Wu, Yingce Xia, Rui Yan. 1102-1123 [doi]

Hyperpolyglot LLMs: Cross-Lingual Interpretability in Token EmbeddingsAndrea W. Wen-Yi, David Mimno. 1124-1131 [doi]

Target-oriented Proactive Dialogue Systems with Personalization: Problem Formulation and Dataset CurationJian Wang, Yi Cheng, Dongding Lin, Chak Tou Leong, Wenjie Li. 1132-1143 [doi]

SeqXGPT: Sentence-Level AI-Generated Text DetectionPengyu Wang, Linyang Li, Ke Ren, Botian Jiang, Dong Zhang, Xipeng Qiu. 1144-1156 [doi]

QTSumm: Query-Focused Summarization over Tabular DataYilun Zhao 0001, Zhenting Qi, Linyong Nan, Boyu Mi, Yixin Liu, Weijin Zou, Simeng Han, Ruizhe Chen, Xiangru Tang, Yumo Xu, Dragomir Radev, Arman Cohan. 1157-1172 [doi]

From Wrong To Right: A Recursive Approach Towards Vision-Language ExplanationJiaxin Ge, Sanjay Subramanian, Trevor Darrell, Boyi Li. 1173-1185 [doi]

'Don't Get Too Technical with Me': A Discourse Structure-Based Framework for Automatic Science JournalismRonald Cardenas, Bingsheng Yao, Dakuo Wang, Yufang Hou 0001. 1186-1202 [doi]

LACMA: Language-Aligning Contrastive Learning with Meta-Actions for Embodied Instruction FollowingCheng-Fu Yang, Yen-Chun Chen, Jianwei Yang, Xiyang Dai, Lu Yuan, Yu-Chiang Frank Wang, Kai-Wei Chang. 1203-1217 [doi]

Penalty Decoding: Well Suppress the Self-Reinforcement Effect in Open-Ended Text GenerationWenhong Zhu, Hongkun Hao, Rui Wang 0015. 1218-1228 [doi]

Towards Robust Pruning: An Adaptive Knowledge-Retention Pruning Strategy for Language ModelsJianwei Li, Qi Lei, Wei Cheng, Dongkuan Xu. 1229-1247 [doi]

Clinical Contradiction DetectionDave Makhervaks, Plia Gillis, Kira Radinsky. 1248-1263 [doi]

Vera: A General-Purpose Plausibility Estimation Model for Commonsense StatementsJiacheng Liu 0010, Wenya Wang, Dianzhuo Wang, Noah A. Smith, Yejin Choi 0001, Hannaneh Hajishirzi. 1264-1287 [doi]

Text-Transport: Toward Learning Causal Effects of Natural LanguageVictoria Lin 0001, Louis-Philippe Morency, Eli Ben-Michael. 1288-1304 [doi]

How Does Generative Retrieval Scale to Millions of Passages?Ronak Pradeep, Kai Hui 0001, Jai Gupta, Ádám D. Lelkes, Honglei Zhuang, Jimmy Lin, Donald Metzler, Vinh Q. Tran 0002. 1305-1321 [doi]

Unveiling the Implicit Toxicity in Large Language ModelsJiaxin Wen, Pei Ke, Hao Sun, Zhexin Zhang, Chengfei Li, Jinfeng Bai, Minlie Huang. 1322-1338 [doi]

Is ChatGPT a General-Purpose Natural Language Processing Task Solver?Chengwei Qin, Aston Zhang, Zhuosheng Zhang 0001, Jiaao Chen, Michihiro Yasunaga, Diyi Yang. 1339-1384 [doi]

Length is a Curse and a Blessing for Document-level SemanticsChenghao Xiao, Yizhi Li, G. Thomas Hudson, Chenghua Lin, Noura Al Moubayed. 1385-1396 [doi]

ALCUNA: Large Language Models Meet New KnowledgeXunjian Yin, Baizhou Huang, Xiaojun Wan 0001. 1397-1414 [doi]

Location-Aware Visual Question Generation with Lightweight ModelsNicholas Collin Suwono, Justin Chih-Yao Chen, Tun-Min Hung, Ting-Hao Huang, I-Bin Liao, Yung-hui Li, Lun-Wei Ku, Shao-Hua Sun. 1415-1432 [doi]

MemeCap: A Dataset for Captioning and Interpreting MemesEunJeong Hwang, Vered Shwartz. 1433-1445 [doi]

Where to start? Analyzing the potential value of intermediate modelsLeshem Choshen, Elad Venezian, Shachar Don-Yehiya, Noam Slonim, Yoav Katz. 1446-1470 [doi]

Transcending Scaling Laws with 0.1% Extra ComputeYi Tay, Jason Wei, Hyung Won Chung, Vinh Q. Tran 0002, David R. So, Siamak Shakeri, Xavier Garcia, Huaixiu Steven Zheng, Jinfeng Rao, Aakanksha Chowdhery, Denny Zhou, Donald Metzler, Slav Petrov, Neil Houlsby, Quoc Le, Mostafa Dehghani 0001. 1471-1486 [doi]

CoAnnotating: Uncertainty-Guided Work Allocation between Human and Large Language Models for Data AnnotationMinzhi Li, Taiwei Shi, Caleb Ziems, Min-Yen Kan, Nancy F. Chen, Zhengyuan Liu, Diyi Yang. 1487-1505 [doi]

Optimizing Retrieval-augmented Reader Models via Token EliminationMoshe Berchansky, Peter Izsak, Avi Caciularu, Ido Dagan, Moshe Wasserblat. 1506-1524 [doi]

WSDMS: Debunk Fake News via Weakly Supervised Detection of Misinforming Sentences with Contextualized Social WisdomRuichao Yang, Wei Gao, Jing Ma 0004, Hongzhan Lin, Zhiwei Yang 0005. 1525-1538 [doi]

Robust Prompt Optimization for Large Language Models Against Distribution ShiftsMoxin Li, Wenjie Wang, Fuli Feng, Yixin Cao 0002, Jizhi Zhang, Tat-Seng Chua. 1539-1554 [doi]

Exploiting Asymmetry for Synthetic Training Data Generation: SynthIE and the Case of Information ExtractionMartin Josifoski, Marija Sakota, Maxime Peyrard, Robert West 0001. 1555-1574 [doi]

Condensing Multilingual Knowledge with Lightweight Language-Specific ModulesHaoran Xu, Weiting Tan, Shuyue Stella Li, Yunmo Chen, Benjamin Van Durme, Philipp Koehn, Kenton Murray. 1575-1587 [doi]

The Framework Tax: Disparities Between Inference Efficiency in NLP Research and DeploymentJared Fernandez, Jacob Kahn, Clara Na, Yonatan Bisk, Emma Strubell. 1588-1600 [doi]

Evaluating Cross-Domain Text-to-SQL Models and BenchmarksMohammadreza Pourreza, Davood Rafiei. 1601-1611 [doi]

Increasing Coverage and Precision of Textual Information in Multilingual Knowledge GraphsSimone Conia, Min Li, Daniel Lee, Umar Farooq Minhas, Ihab F. Ilyas, Yunyao Li 0001. 1612-1634 [doi]

Memory-Based Invariance Learning for Out-of-Domain Text ClassificationChen Jia, Yue Zhang. 1635-1647 [doi]

Outlier Suppression+: Accurate quantization of large language models by equivalent and effective shifting and scalingXiuying Wei, Yunchen Zhang, Yuhang Li, Xiangguo Zhang, Ruihao Gong, Jinyang Guo, Xianglong Liu 0001. 1648-1665 [doi]

Three Stream Based Multi-level Event Contrastive Learning for Text-Video Event ExtractionJiaqi Li, Chuanyi Zhang, Miaozeng Du, Dehai Min, Yongrui Chen 0002, Guilin Qi. 1666-1676 [doi]

Diversify Question Generation with Retrieval-Augmented Style TransferQi Gou, Zehua Xia, Bowen Yu 0002, Haiyang Yu, Fei Huang 0004, Yongbin Li, Cam-Tu Nguyen. 1677-1690 [doi]

Fast and Accurate Factual Inconsistency Detection Over Long DocumentsBarrett Martin Lattimer, Patrick Chen, Xinyuan Zhang 0001, Yi Yang. 1691-1703 [doi]

Interpreting Embedding Spaces by ConceptualizationAdi Simhi, Shaul Markovitch. 1704-1719 [doi]

Knowledge-Augmented Language Model VerificationJinheon Baek, Soyeong Jeong, Minki Kang, Jong Park, Sung Ju Hwang. 1720-1736 [doi]

A Generation-based Deductive Method for Math Word ProblemsYuxuan Hu, Jing Zhang, Haoyang Li, Cuiping Li, Hong Chen. 1737-1750 [doi]

Failures Pave the Way: Enhancing Large Language Models through Tuning-free Rule AccumulationZeyuan Yang, Peng Li, Yang Liu. 1751-1777 [doi]

Building Persona Consistent Dialogue Agents with Offline Reinforcement LearningRyan Shea, Zhou Yu. 1778-1795 [doi]

Augmenting Zero-Shot Dense Retrievers with Plug-in Mixture-of-MemoriesSuyu Ge, Chenyan Xiong, Corby Rosset, Arnold Overwijk, Jiawei Han 0001, Paul Bennett 0001. 1796-1812 [doi]

Active Instruction Tuning: Improving Cross-Task Generalization by Training on Prompt Sensitive TasksPo-Nien Kung, Fan Yin, Di Wu 0054, Kai-Wei Chang, Nanyun Peng. 1813-1829 [doi]

Towards Example-Based NMT with Multi-Levenshtein TransformersMaxime Bouthors, Josep Maria Crego, François Yvon. 1830-1846 [doi]

DUnE: Dataset for Unified EditingAfra Feyza Akyürek, Eric Pan, Garry Kuwanto, Derry Wijaya. 1847-1861 [doi]

"Fifty Shades of Bias": Normative Ratings of Gender Bias in GPT Generated English TextRishav Hada, Agrima Seth, Harshita Diddee, Kalika Bali. 1862-1876 [doi]

Hybrid Inverted Index Is a Robust Accelerator for Dense RetrievalPeitian Zhang, Zheng Liu, Shitao Xiao, Zhicheng Dou, Jing Yao. 1877-1888 [doi]

ChatGPT to Replace Crowdsourcing of Paraphrases for Intent Classification: Higher Diversity and Comparable Model RobustnessJán Cegin, Jakub Simko, Peter Brusilovsky. 1889-1905 [doi]

Query-as-context Pre-training for Dense Passage RetrievalXing Wu, Guangyuan Ma, Wanhui Qian, Zijia Lin, Songlin Hu. 1906-1916 [doi]

A Suite of Generative Tasks for Multi-Level Multimodal Webpage UnderstandingAndrea Burns, Krishna Srinivasan, Joshua Ainslie, Geoff Brown, Bryan A. Plummer, Kate Saenko, Jianmo Ni, Mandy Guo. 1917-1947 [doi]

Democratizing Reasoning Ability: Tailored Learning from Large Language ModelZhaoyang Wang, Shaohan Huang, Yuxuan Liu, Jiahai Wang, Minghui Song, Zihan Zhang, Haizhen Huang, Furu Wei, Weiwei Deng, Feng Sun, Qi Zhang. 1948-1966 [doi]

OpenAsp: A Benchmark for Multi-document Open Aspect-based SummarizationShmuel Amar, Liat Schiff, Ori Ernst, Asi Shefer, Ori Shapira, Ido Dagan. 1967-1991 [doi]

PEFTDebias : Capturing debiasing information using PEFTsSumit Agarwal, Aditya Srikanth Veerubhotla, Srijan Bansal. 1992-2000 [doi]

Byte Pair Encoding for Symbolic MusicNathan Fradet, Nicolas Gutowski, Fabien Chhel, Jean-Pierre Briot. 2001-2020 [doi]

Combining Denoising Autoencoders with Contrastive Learning to fine-tune Transformer ModelsAlejo Lopez-Avila, Víctor Suárez-Paniagua. 2021-2032 [doi]

Self-Influence Guided Data Reweighting for Language Model Pre-trainingMegh Thakkar, Tolga Bolukbasi, Sriram Ganapathy, Shikhar Vashishth, Sarath Chandar, Partha Talukdar. 2033-2045 [doi]

ACTOR: Active Learning with Annotator-specific Classification Heads to Embrace Human Label VariationXinpeng Wang, Barbara Plank. 2046-2052 [doi]

TrueTeacher: Learning Factual Consistency Evaluation with Large Language ModelsZorik Gekhman, Jonathan Herzig, Roee Aharoni, Chen Elkind, Idan Szpektor. 2053-2070 [doi]

VivesDebate-Speech: A Corpus of Spoken Argumentation to Leverage Audio Features for Argument MiningRamon Ruiz-Dolz, Javier Sanchez. 2071-2077 [doi]

Tagging-Assisted Generation Model with Encoder and Decoder Supervision for Aspect Sentiment Triplet ExtractionLuo Xianlong, Meng Yang, Yihao Wang. 2078-2093 [doi]

Larger Probes Tell a Different Story: Extending Psycholinguistic Datasets Via In-Context LearningNamrata Shivagunde, Vladislav Lialin, Anna Rumshisky. 2094-2107 [doi]

Norm of Word Embedding Encodes Information GainMomose Oyama, Sho Yokoi, Hidetoshi Shimodaira. 2108-2130 [doi]

CRT-QA: A Dataset of Complex Reasoning Question Answering over Tabular DataZhehao Zhang, Xitao Li, Yan Gao 0002, Jian-Guang Lou. 2131-2153 [doi]

Promoting Topic Coherence and Inter-Document Consorts in Multi-Document Summarization via Simplicial Complex and Sheaf GraphYash Kumar Atri, Arun Iyer, Tanmoy Chakraborty 0002, Vikram Goyal. 2154-2166 [doi]

MAGNIFICo: Evaluating the In-Context Learning Ability of Large Language Models to Generalize to Novel InterpretationsArkil Patel, Satwik Bhattamishra, Siva Reddy, Dzmitry Bahdanau. 2167-2189 [doi]

Generating and Evaluating Tests for K-12 Students with Language Model Simulations: A Case Study on Sentence Reading EfficiencyEric Zelikman, Wanjing Anya Ma, Jasmine E. Tran, Diyi Yang, Jason D. Yeatman, Nick Haber. 2190-2205 [doi]

Counter Turing Test (CT2): AI-Generated Text Detection is Not as Easy as You May Think - Introducing AI Detectability Index (ADI)Megha Chakraborty, S. M. Towhidul Islam Tonmoy, S. M. Mehedi Zaman, Shreya Gautam, Tanay Kumar, Krish Sharma, Niyar R. Barman, Chandan Gupta, Vinija Jain, Aman Chadha, Amit P. Sheth, Amitava Das. 2206-2239 [doi]

Revisiting the Optimality of Word LengthsTiago Pimentel, Clara Meister, Ethan Wilcox, Kyle Mahowald, Ryan Cotterell. 2240-2255 [doi]

Document-level Relationship Extraction by Bidirectional Constraints of Beta RulesYichun Liu, Zizhong Zhu, Xiaowang Zhang, Zhiyong Feng 0002, Daoqi Chen, Yaxin Li 0007. 2256-2266 [doi]

Instructed Language Models with Retrievers Are Powerful Entity LinkersZilin Xiao, Ming Gong, Jie Wu, Xingyao Zhang, Linjun Shou, Daxin Jiang. 2267-2282 [doi]

Towards Noise-Tolerant Speech-Referring Video Object Segmentation: Bridging Speech and TextXiang Li, Jinglu Wang, Xiaohao Xu, Muqiao Yang, Fan Yang, Yizhou Zhao, Rita Singh, Bhiksha Raj. 2283-2296 [doi]

PROSE: A Pronoun Omission Solution for Chinese-English Spoken Language TranslationKe Wang, Xiutian Zhao, Yanghui Li, Wei Peng. 2297-2311 [doi]

A Diachronic Analysis of Paradigm Shifts in NLP Research: When, How, and Why?Aniket Pramanick, Yufang Hou, Saif M. Mohammad, Iryna Gurevych. 2312-2326 [doi]

Does the Correctness of Factual Knowledge Matter for Factual Knowledge-Enhanced Pre-trained Language Models?Boxi Cao, Qiaoyu Tang, Hongyu Lin, Xianpei Han, Le Sun 0001. 2327-2340 [doi]

Syntactic Substitutability as Unsupervised Dependency SyntaxJasper Jian, Siva Reddy. 2341-2360 [doi]

MProto: Multi-Prototype Network with Denoised Optimal Transport for Distantly Supervised Named Entity RecognitionShuhui Wu, Yongliang Shen 0001, Zeqi Tan, Wenqi Ren, Jietian Guo, Shiliang Pu, Weiming Lu 0001. 2361-2374 [doi]

The Shifted and The Overlooked: A Task-oriented Investigation of User-GPT InteractionsSiru Ouyang, Shuohang Wang, Yang Liu, Ming Zhong 0005, Yizhu Jiao, Dan Iter, Reid Pryzant, Chenguang Zhu, Heng Ji, Jiawei Han 0001. 2375-2393 [doi]

Learning the Visualness of Text Using Large Vision-Language ModelsGaurav Verma, Ryan A. Rossi, Christopher Tensmeyer, Jiuxiang Gu, Ani Nenkova. 2394-2408 [doi]

The Past, Present and Better Future of Feedback Learning in Large Language Models for Subjective Human Preferences and ValuesHannah Kirk, Andrew M. Bean, Bertie Vidgen, Paul Röttger, Scott A. Hale. 2409-2430 [doi]

TempTabQA: Temporal Question Answering for Semi-Structured TablesVivek Gupta 0001, Pranshu Kandoi, Mahek Bhavesh Vora, Shuo Zhang, Yujie He, Ridho Reinanda, Vivek Srikumar. 2431-2453 [doi]

Task-Level Thinking Steps Help Large Language Models for Challenging Classification TaskChunhui Du, Jidong Tian, Haoran Liao, Jindou Chen, Hao He 0007, Yaohui Jin. 2454-2470 [doi]

RepoCoder: Repository-Level Code Completion Through Iterative Retrieval and GenerationFengji Zhang, Bei Chen, Yue Zhang, Jacky Keung, Jin Liu, Daoguang Zan, Yi Mao, Jian-Guang Lou, Weizhu Chen. 2471-2484 [doi]

Influence Scores at Scale for Efficient Language Data SamplingNikhil Anand, Joshua Tan, Maria Minakova. 2485-2510 [doi]

G-Eval: NLG Evaluation using Gpt-4 with Better Human AlignmentYang Liu, Dan Iter, Yichong Xu, Shuohang Wang, Ruochen Xu, Chenguang Zhu. 2511-2522 [doi]

Learning Retrieval Augmentation for Personalized Dialogue GenerationQiushi Huang, Shuai Fu, Xubo Liu, Wenwu Wang 0001, Tom Ko, Yu Zhang 0006, Lilian H. Y. Tang. 2523-2540 [doi]

The Troubling Emergence of Hallucination in Large Language Models - An Extensive Definition, Quantification, and Prescriptive RemediationsVipula Rawte, Swagata Chakraborty, Agnibh Pathak, Anubhav Sarkar, S. M. Towhidul Islam Tonmoy, Aman Chadha, Amit P. Sheth, Amitava Das. 2541-2573 [doi]

NAIL: Lexical Retrieval Indices with Efficient Non-Autoregressive DecodersLivio Soares, Daniel Gillick, Jeremy R. Cole, Tom Kwiatkowski. 2574-2589 [doi]

Analyzing Modular Approaches for Visual Question DecompositionApoorv Khandelwal 0001, Ellie Pavlick, Chen Sun. 2590-2603 [doi]

Improving Summarization with Human EditsZonghai Yao, Benjamin J. Schloss, Sai P. Selvaraj. 2604-2620 [doi]

Did You Mean...? Confidence-based Trade-offs in Semantic ParsingElias Stengel-Eskin, Benjamin Van Durme. 2621-2629 [doi]

The Skipped Beat: A Study of Sociopragmatic Understanding in LLMs for 64 LanguagesChiyu Zhang, Khai Duy Doan, Qisheng Liao, Muhammad Abdul-Mageed. 2630-2662 [doi]

Understanding the Effect of Model Compression on Social Bias in Large Language ModelsGustavo Gonçalves, Emma Strubell. 2663-2675 [doi]

BioPlanner: Automatic Evaluation of LLMs on Protocol Planning in BiologyOdhran O'Donoghue, Aleksandar Shtedritski, John Ginger, Ralph Abboud, Ali Essa Ghareeb, Samuel G. Rodriques. 2676-2694 [doi]

Cross-lingual Prompting: Improving Zero-shot Chain-of-Thought Reasoning across LanguagesLibo Qin 0001, Qiguang Chen, Fuxuan Wei, Shijue Huang, Wanxiang Che. 2695-2709 [doi]

FinGPT: Large Generative Models for a Small LanguageRisto Luukkonen, Ville Komulainen, Jouni Luoma, Anni Eskelinen, Jenna Kanerva, Hanna-Mari Kupari, Filip Ginter, Veronika Laippala, Niklas Muennighoff, Aleksandra Piktus, Thomas Wang, Nouamane Tazi, Teven Le Scao, Thomas Wolf 0008, Osma Suominen, Samuli Sairanen, Mikko Merioksa, Jyrki Heinonen, Aija Vahtola, Samuel Antao, Sampo Pyysalo. 2710-2726 [doi]

Boosting Summarization with Normalizing Flows and Aggressive TrainingYu Yang, Xiaotong Shen. 2727-2751 [doi]

Indicative Summarization of Long DiscussionsShahbaz Syed, Dominik Schwabe, Khalid Al Khatib, Martin Potthast. 2752-2788 [doi]

A Framework for Vision-Language Warm-up Tasks in Multimodal Dialogue ModelsJaewook Lee, Seongsik Park, Seong-Heum Park, Hongjin Kim, Harksoo Kim. 2789-2799 [doi]

Once is Enough: A Light-Weight Cross-Attention for Fast Sentence Pair ModelingYuanhang Yang, Shiyi Qi, Chuanyi Liu, Qifan Wang, Cuiyun Gao, Zenglin Xu. 2800-2806 [doi]

Plan, Verify and Switch: Integrated Reasoning with Diverse X-of-ThoughtsTengxiao Liu, Qipeng Guo, Yuqing Yang 0004, Xiangkun Hu, Yue Zhang, Xipeng Qiu, Zheng Zhang. 2807-2822 [doi]

GLEN: General-Purpose Event Detection for Thousands of TypesSha Li, Qiusi Zhan, Kathryn Conger, Martha Palmer, Heng Ji, Jiawei Han 0001. 2823-2838 [doi]

Hierarchical Pretraining on Multimodal Electronic Health RecordsXiaochen Wang, Junyu Luo, Jiaqi Wang, Ziyi Yin 0003, Suhan Cui, Yuan Zhong, Yaqing Wang, Fenglong Ma. 2839-2852 [doi]

Critic-Driven Decoding for Mitigating Hallucinations in Data-to-text GenerationMateusz Lango, Ondrej Dusek. 2853-2862 [doi]

Bridging the Gap between Synthetic and Authentic Images for Multimodal Machine TranslationWenyu Guo, Qingkai Fang, Dong Yu 0003, Yang Feng 0004. 2863-2874 [doi]

DEPN: Detecting and Editing Privacy Neurons in Pretrained Language ModelsXinwei Wu, Junzhuo Li, Minghui Xu, Weilong Dong, Shuangzhi Wu, Chao Bian 0006, Deyi Xiong. 2875-2886 [doi]

Investigating Bias in Multilingual Language Models: Cross-Lingual Transfer of Debiasing TechniquesManon Reusens, Philipp Borchert, Margot Mieskes, Jochen De Weerdt, Bart Baesens. 2887-2896 [doi]

Can Language Models Laugh at YouTube Short-form Videos?Dayoon Ko, Sangho Lee, Gunhee Kim. 2897-2916 [doi]

Random Entity Quantization for Parameter-Efficient Compositional Knowledge Graph RepresentationJiaang Li, Quan Wang, Yi Liu, Licheng Zhang, Zhendong Mao. 2917-2928 [doi]

Exploring All-In-One Knowledge Distillation Framework for Neural Machine TranslationZhongjian Miao, Wen Zhang, Jinsong Su, Xiang Li, Jian Luan 0001, Yidong Chen, Bin Wang 0004, Min Zhang 0005. 2929-2940 [doi]

HistAlign: Improving Context Dependency in Language Generation by Aligning with HistoryDavid Wan, Shiyue Zhang, Mohit Bansal. 2941-2960 [doi]

CombLM: Adapting Black-Box Language Models through Small Fine-Tuned ModelsAitor Ormazabal, Mikel Artetxe, Eneko Agirre. 2961-2974 [doi]

Image Manipulation via Multi-Hop Instructions - A New Dataset and Weakly-Supervised Neuro-Symbolic ApproachHarman Singh, Poorva Garg, Mohit Gupta, Kevin Shah, Ashish Goswami, Satyam Modi, Arnab Kumar Mondal, Dinesh Khandelwal, Dinesh Garg, Parag Singla. 2975-3007 [doi]

Generative Spoken Language Model based on continuous word-sized audio tokensRobin Algayres, Yossi Adi, Tu Anh Nguyen, Jade Copet, Gabriel Synnaeve, Benoît Sagot, Emmanuel Dupoux. 3008-3028 [doi]

Enhancing Chat Language Models by Scaling High-quality Instructional ConversationsNing Ding, Yulin Chen, Bokai Xu, Yujia Qin, Shengding Hu, Zhiyuan Liu, Maosong Sun 0001, Bowen Zhou. 3029-3051 [doi]

Weakly-Supervised Learning of Visual Relations in Multimodal PretrainingEmanuele Bugliarello, Aida Nematzadeh, Lisa Anne Hendricks. 3052-3071 [doi]

Unsupervised Grammatical Error Correction Rivaling Supervised MethodsHannan Cao, Liping Yuan, Yuchen Zhang, Hwee Tou Ng. 3072-3088 [doi]

S2abEL: A Dataset for Entity Linking from Scientific TablesYuze Lou, Bailey Kuehl, Erin Bransom, Sergey Feldman, Aakanksha Naik, Doug Downey. 3089-3101 [doi]

API-Bank: A Comprehensive Benchmark for Tool-Augmented LLMsMinghao Li, Yingxiu Zhao, Bowen Yu 0002, Feifan Song 0001, Hangyu Li 0003, Haiyang Yu, Zhoujun Li, Fei Huang, Yongbin Li. 3102-3116 [doi]

Language and Mental Health: Measures of Emotion Dynamics from Text as Linguistic Biosocial MarkersDaniela Teodorescu, Tiffany Cheng, Alona Fyshe, Saif M. Mohammad. 3117-3133 [doi]

Lion: Adversarial Distillation of Proprietary Large Language ModelsYuxin Jiang, Chunkit Chan, Mingyang Chen, Wei Wang. 3134-3154 [doi]

Evaluating Large Language Models on Controlled Generation TasksJiao Sun, Yufei Tian, Wangchunshu Zhou, Nan Xu, Qian Hu, Rahul Gupta 0001, John Frederick Wieting, Nanyun Peng, Xuezhe Ma. 3155-3168 [doi]

DeSIQ: Towards an Unbiased, Challenging Benchmark for Social Intelligence UnderstandingXiaoyu Guo, Yuan-Fang Li, Reza Haf. 3169-3180 [doi]

Why LLMs Hallucinate, and How to Get (Evidential) Closure: Perceptual, Intensional, and Extensional Learning for Faithful Natural Language GenerationAdam Bouyamourn. 3181-3193 [doi]

A Question Answering Framework for Decontextualizing User-facing Snippets from Scientific DocumentsBenjamin Newman, Luca Soldaini, Raymond Fok, Arman Cohan, Kyle Lo. 3194-3212 [doi]

SLOG: A Structural Generalization Benchmark for Semantic ParsingBingzhi Li, Lucia Donatelli, Alexander Koller, Tal Linzen, Yuekun Yao, Najoung Kim. 3213-3232 [doi]

Pushdown Layers: Encoding Recursive Structure in Transformer Language ModelsShikhar Murty, Pratyusha Sharma, Jacob Andreas, Christopher D. Manning. 3233-3247 [doi]

Can LLMs Facilitate Interpretation of Pre-trained Language Models?Basel Mousi, Nadir Durrani, Fahim Dalvi. 3248-3268 [doi]

Enhancing Low-resource Fine-grained Named Entity Recognition by Leveraging Coarse-grained DatasetsSu Ah Lee, Seokjin Oh, Woohwan Jung. 3269-3279 [doi]

Oolong: Investigating What Makes Transfer Learning Hard with Controlled StudiesZhengxuan Wu, Alex Tamkin, Isabel Papadimitriou. 3280-3289 [doi]

Non-Autoregressive Math Word Problem Solver with Unified Tree StructureYi Bin, Mengqun Han, Wenhao Shi, Lei Wang, Yang Yang 0002, See-Kiong Ng, Heng Tao Shen. 3290-3301 [doi]

Improving Chinese Pop Song and Hokkien Gezi Opera Singing Voice Synthesis by Enhancing Local ModelingPeng Bai, Yue Zhou, Meizhen Zheng, Wujin Sun, Xiaodong Shi. 3302-3312 [doi]

What Else Do I Need to Know? The Effect of Background Information on Users' Reliance on QA SystemsNavita Goyal, Eleftheria Briakou, Amanda Liu, Connor Baumler, Claire Bonial, Jeffrey Micher, Clare R. Voss, Marine Carpuat, Hal Daumé III. 3313-3330 [doi]

GROOViST: A Metric for Grounding Objects in Visual StorytellingAditya K. Surikuchi, Sandro Pezzelle, Raquel Fernández. 3331-3339 [doi]

VIBE: Topic-Driven Temporal Adaptation for Twitter ClassificationYuji Zhang, Jing Li, Wenjie Li. 3340-3354 [doi]

TOD-Flow: Modeling the Structure of Task-Oriented DialoguesSungryull Sohn, Yiwei Lyu, Anthony Z. Liu, Lajanugen Logeswaran, Dong Ki Kim, Dongsub Shim, Honglak Lee. 3355-3371 [doi]

TopWORDS-Poetry: Simultaneous Text Segmentation and Word Discovery for Classical Chinese Poetry via Bayesian InferenceChangzai Pan, Feiyue Li, Ke Deng. 3372-3386 [doi]

Knowledge Rumination for Pre-trained Language ModelsYunzhi Yao, Peng Wang, Shengyu Mao, Chuanqi Tan, Fei Huang, Huajun Chen, Ningyu Zhang 0001. 3387-3404 [doi]

Struct-XLM: A Structure Discovery Multilingual Language Model for Enhancing Cross-lingual Transfer through Reinforcement LearningLinjuan Wu, Weiming Lu. 3405-3419 [doi]

AdaSent: Efficient Domain-Adapted Sentence Embeddings for Few-Shot ClassificationYongxin Huang, Kexin Wang, Sourav Dutta 0001, Raj Nath Patel, Goran Glavas, Iryna Gurevych. 3420-3434 [doi]

Interview Evaluation: A Novel Approach for Automatic Evaluation of Conversational Question Answering ModelsXibo Li, Bowei Zou, Yifan Fan, Yanling Li, Ai Ti Aw, Yu Hong. 3435-3446 [doi]

TCFLE-8: a Corpus of Learner Written Productions for French as a Foreign Language and its Application to Automated Essay ScoringRodrigo Wilkens, Alice Pintard, David Alfter, Vincent Folny, Thomas François. 3447-3465 [doi]

Dancing Between Success and Failure: Edit-level Simplification Evaluation using SALSADavid Heineman, Yao Dou, Mounica Maddela, Wei Xu. 3466-3495 [doi]

Confidence-based Ensembling of Perspective-aware ModelsSilvia Casola, Soda Marem Lo, Valerio Basile, Simona Frenda, Alessandra Teresa Cignarella, Viviana Patti, Cristina Bosco. 3496-3507 [doi]

ToViLaG: Your Visual-Language Generative Model is Also An EvildoerXinpeng Wang, Xiaoyuan Yi, Han Jiang 0007, Shanlin Zhou, Zhihua Wei, Xing Xie 0001. 3508-3533 [doi]

GPT-RE: In-context Learning for Relation Extraction using Large Language ModelsZhen Wan, Fei Cheng, Zhuoyuan Mao, Qianying Liu, Haiyue Song, Jiwei Li, Sadao Kurohashi. 3534-3547 [doi]

Sociocultural Norm Similarities and Differences via Situational Alignment and Explainable Textual EntailmentSky CH-Wang, Arkadiy Saakyan, Oliver Li, Zhou Yu, Smaranda Muresan. 3548-3564 [doi]

INFORM : Information eNtropy based multi-step reasoning FOR large language ModelsChuyue Zhou, Wangjie You, Juntao Li, Jing Ye, Kehai Chen, Min Zhang. 3565-3576 [doi]

Adaptive Gating in Mixture-of-Experts based Language ModelsJiamin Li, Qiang Su, Yitao Yang, Yimin Jiang, Cong Wang, Hong Xu. 3577-3587 [doi]

On the Automatic Generation and Simplification of Children's StoriesMaria Valentini, Jennifer Weber, Jesus Salcido, Téa Wright, Eliana Colunga, Katharina von der Wense. 3588-3598 [doi]

When Do Decompositions Help for Machine Reading?Kangda Wei, Dawn J. Lawrie, Benjamin Van Durme, Yunmo Chen, Orion Weller. 3599-3606 [doi]

The Curious Case of Hallucinatory (Un)answerability: Finding Truths in the Hidden States of Over-Confident Large Language ModelsAviv Slobodkin, Omer Goldman, Avi Caciularu, Ido Dagan, Shauli Ravfogel. 3607-3625 [doi]

Identifying Informational Sources in News ArticlesAlexander Spangher, Nanyun Peng, Emilio Ferrara, Jonathan May. 3626-3639 [doi]

Retrofitting Light-weight Language Models for Emotions using Supervised Contrastive LearningSapan Shah, Sreedhar Reddy, Pushpak Bhattacharyya. 3640-3654 [doi]

Longtriever: a Pre-trained Long Text Encoder for Dense Document RetrievalJunhan Yang, Zheng Liu, Chaozhuo Li, Guangzhong Sun, Xing Xie 0001. 3655-3665 [doi]

Revisiting De-Identification of Electronic Medical Records: Evaluation of Within- and Cross-Hospital GeneralizationYiyang Liu, Jinpeng Li 0002, Enwei Zhu. 3666-3674 [doi]

Small Language Models Fine-tuned to Coordinate Larger Language Models improve Complex ReasoningGurusha Juneja, Subhabrata Dutta, Soumen Chakrabarti, Sunny Manchanda, Tanmoy Chakraborty 0002. 3675-3691 [doi]

Language Representation Projection: Can We Transfer Factual Knowledge across Languages in Multilingual Language Models?Shaoyang Xu, Junzhuo Li, Deyi Xiong. 3692-3702 [doi]

Structural Priming Demonstrates Abstract Grammatical Representations in Multilingual Language ModelsJames A. Michaelov, Catherine Arnett, Tyler A. Chang, Ben Bergen 0001. 3703-3720 [doi]

ReasoningLM: Enabling Structural Subgraph Reasoning in Pre-trained Language Models for Question Answering over Knowledge GraphJinhao Jiang, Kun Zhou, Xin Zhao, Yaliang Li, Ji-Rong Wen. 3721-3735 [doi]

Deep Natural Language Feature Learning for Interpretable PredictionFelipe Urrutia, Cristian Buc Calderon, Valentin Barrière. 3736-3763 [doi]

ROBBIE: Robust Bias Evaluation of Large Generative Language ModelsDavid Esiobu, Xiaoqing Ellen Tan, Saghar Hosseini, Megan Ung, Yuchen Zhang, Jude Fernandes, Jane Dwivedi-Yu, Eleonora Presani, Adina Williams, Eric Michael Smith. 3764-3814 [doi]

Enhancing Task-oriented Dialogue Systems with Generative Post-processing NetworksAtsumoto Ohashi, Ryuichiro Higashinaka. 3815-3828 [doi]

Adapting Language Models to Compress ContextsAlexis Chevalier, Alexander Wettig, Anirudh Ajith, Danqi Chen. 3829-3846 [doi]

Selective Labeling: How to Radically Lower Data-Labeling Costs for Document Extraction ModelsYichao Zhou 0001, James B. Wendt, Navneet Potti, Jing Xie 0002, Sandeep Tata. 3847-3860 [doi]

TRAVEL: Tag-Aware Conversational FAQ Retrieval via Reinforcement LearningYue Chen, Dingnan Jin, Chen Huang, Jia Liu, Wenqiang Lei. 3861-3872 [doi]

Continual Dialogue State Tracking via Example-Guided Question AnsweringHyundong Cho, Andrea Madotto, Zhaojiang Lin, Khyathi Raghavi Chandu, Satwik Kottur, Jing Xu, Jonathan May, Chinnadhurai Sankar. 3873-3886 [doi]

Lost in Translation, Found in Spans: Identifying Claims in Multilingual Social MediaShubham Mittal 0001, Megha Sundriyal, Preslav Nakov. 3887-3902 [doi]

COVID-19 Vaccine Misinformation in Middle Income CountriesJongin Kim, Byeo Bak, Aditya Agrawal, Jiaxi Wu, Veronika J. Wirtz, Traci Hong, Derry Wijaya. 3903-3915 [doi]

Contrastive Learning of Sentence Embeddings from ScratchJunlei Zhang, Zhenzhong Lan, Junxian He. 3916-3932 [doi]

A Rose by Any Other Name would not Smell as Sweet: Social Bias in Names MistranslationSandra Sandoval, Jieyu Zhao, Marine Carpuat, Hal Daumé III. 3933-3945 [doi]

Investigating Efficiently Extending Transformers for Long Input SummarizationJason Phang, Yao Zhao, Peter J. Liu. 3946-3961 [doi]

CS2W: A Chinese Spoken-to-Written Style Conversion Dataset with Multiple Conversion TypesZishan Guo, Linhao Yu, Minghui Xu, Renren Jin, Deyi Xiong. 3962-3979 [doi]

Unifying Cross-Lingual Transfer across Scenarios of Resource ScarcityAlan Ansell, Marinela Parovic, Ivan Vulic, Anna Korhonen, Edoardo M. Ponti. 3980-3995 [doi]

A Tale of Pronouns: Interpretability Informs Gender Bias Mitigation for Fairer Instruction-Tuned Machine TranslationGiuseppe Attanasio, Flor Miriam Plaza del Arco, Debora Nozza, Anne Lauscher. 3996-4014 [doi]

DisCo: Distilled Student Models Co-training for Semi-supervised Text MiningWeifeng Jiang, Qianren Mao, Chenghua Lin, Jianxin Li, Ting Deng, Weiyi Yang, Zheng Wang. 4015-4030 [doi]

Dynosaur: A Dynamic Growth Paradigm for Instruction-Tuning Data CurationDa Yin, Xiao Liu, Fan Yin, Ming Zhong, Hritik Bansal, Jiawei Han 0001, Kai-Wei Chang. 4031-4047 [doi]

Are All Steps Equally Important? Benchmarking Essentiality Detection in Event ProcessesHaoyu Wang 0005, Hongming Zhang, Yueguan Wang, Yuqian Deng, Muhao Chen, Dan Roth. 4048-4056 [doi]

Language Model is Suitable for Correction of Handwritten Mathematical Expressions RecognitionZui Chen, Jiaqi Han, Chaofan Yang, Yi Zhou. 4057-4068 [doi]

Vicinal Risk Minimization for Few-Shot Cross-lingual Transfer in Abusive Language DetectionGretel Liz De la Peña Sarracén, Paolo Rosso, Robert Litschko, Goran Glavas, Simone Paolo Ponzetto. 4069-4085 [doi]

SuperDialseg: A Large-scale Dataset for Supervised Dialogue SegmentationJunfeng Jiang, Chengzhang Dong, Sadao Kurohashi, Akiko Aizawa. 4086-4101 [doi]

ATFormer: A Learned Performance Model with Transfer Learning Across Devices for Deep Learning Tensor ProgramsYang Bai, Wenqian Zhao, Shuo Yin, Zixiao Wang, Bei Yu 0001. 4102-4116 [doi]

mRedditSum: A Multimodal Abstractive Summarization Dataset of Reddit Threads with ImagesKeighley Overbay, Jaewoo Ahn, Fatemeh Pesaran zadeh, Joonsuk Park, Gunhee Kim. 4117-4132 [doi]

Sparse Low-rank Adaptation of Pre-trained Language ModelsNing Ding, Xingtai Lv, Qiaosen Wang, Yulin Chen, Bowen Zhou, Zhiyuan Liu, Maosong Sun 0001. 4133-4145 [doi]

Human Learning by Model Feedback: The Dynamics of Iterative Prompting with MidjourneyShachar Don-Yehiya, Leshem Choshen, Omri Abend. 4146-4161 [doi]

ULF: Unsupervised Labeling Function Correction using Cross-Validation for Weak SupervisionAnastasiia Sedova, Benjamin Roth 0001. 4162-4176 [doi]

The Art of SOCRATIC QUESTIONING: Recursive Thinking with Large Language ModelsJingyuan Qi, Zhiyang Xu, Ying Shen, Minqian Liu, Di Jin, Qifan Wang, Lifu Huang. 4177-4199 [doi]

Ideology Takes Multiple Looks: A High-Quality Dataset for Multifaceted Ideology DetectionSongtao Liu, Ziling Luo, Minghua Xu 0001, Lixiao Wei, Ziyao Wei, Han Yu, Wei Xiang 0005, Bang Wang. 4200-4213 [doi]

Transductive Learning for Textual Few-Shot Classification in API-based Embedding ModelsPierre Colombo, Victor Pellegrain, Malik Boudiaf, Myriam Tami, Victor Storchan, Ismail Ben Ayed, Pablo Piantanida. 4214-4231 [doi]

MEGA: Multilingual Evaluation of Generative AIKabir Ahuja, Harshita Diddee, Rishav Hada, Millicent Ochieng, Krithika Ramesh, Prachi Jain, Akshay Uttama Nambi, Tanuja Ganu, Sameer Segal, Mohamed Ahmed, Kalika Bali, Sunayana Sitaram. 4232-4267 [doi]

Support or Refute: Analyzing the Stance of Evidence to Detect Out-of-Context Mis- and DisinformationXin Yuan, Jie Guo, Weidong Qiu, Zheng Huang, Shujun Li. 4268-4280 [doi]

Video-Helpful Multimodal Machine TranslationYihang Li, Shuichiro Shimizu, Chenhui Chu, Sadao Kurohashi, Wei Li. 4281-4299 [doi]

Large Language Models are Temporal and Causal Reasoners for Video Question AnsweringDohwan Ko, Ji Soo Lee, Woo-Young Kang, Byungseok Roh, Hyunwoo Kim. 4300-4316 [doi]

Uncertainty Guided Global Memory Improves Multi-Hop Question AnsweringAlsu Sagirova, Mikhail Burtsev 0001. 4317-4328 [doi]

Prompting Large Language Models with Chain-of-Thought for Few-Shot Knowledge Base Question GenerationYuanyuan Liang, Jianing Wang, Hanlun Zhu, Lei Wang, Weining Qian, Yunshi Lan. 4329-4343 [doi]

TrojanSQL: SQL Injection against Natural Language Interface to DatabaseJinchuan Zhang, Yan Zhou, Binyuan Hui, Yaxin Liu, Ziming Li, Songlin Hu. 4344-4359 [doi]

Preserving Privacy Through Dememorization: An Unlearning Technique For Mitigating Memorization Risks In Language ModelsAly Kassem, Omar Mahmoud, Sherif Saad. 4360-4379 [doi]

MingOfficial: A Ming Official Career Dataset and a Historical Context-Aware Representation Learning FrameworkYou-jun Chen, Hsin-Yi Hsieh, Yu Lin, Yingtao Tian, Bert Chan, Yu-Sin Liu, Yi-Hsuan Lin, Richard Tzong-Han Tsai. 4380-4401 [doi]

DPP-TTS: Diversifying prosodic features of speech via determinantal point processesSeongho Joo, Hyukhun Koh, Kyomin Jung. 4402-4417 [doi]

Meta-Learning Online Adaptation of Language ModelsNathan Hu, Eric Mitchell, Christopher D. Manning, Chelsea Finn. 4418-4432 [doi]

Self-Detoxifying Language Models via Toxification ReversalChak Tou Leong, Yi Cheng, Jiashuo Wang, Jian Wang, Wenjie Li. 4433-4449 [doi]

Interactive Text GenerationFelix Faltings, Michel Galley, Kianté Brantley, Baolin Peng, Weixin Cai, Yizhe Zhang 0002, Jianfeng Gao, Bill Dolan. 4450-4468 [doi]

Knowledge Distillation \approx Label Smoothing: Fact or Fallacy?Md. Sultan. 4469-4477 [doi]

Analyzing Cognitive Plausibility of Subword TokenizationLisa Beinborn, Yuval Pinter. 4478-4486 [doi]

POE: Process of Elimination for Multiple Choice ReasoningChenkai Ma, Xinya Du. 4487-4496 [doi]

NeuSTIP: A Neuro-Symbolic Model for Link and Time Prediction in Temporal Knowledge GraphsNavdeep Kaur Ishaan Singh, Mausam Garima Gaur. 4497-4516 [doi]

Standardizing Distress Analysis: Emotion-Driven Distress Identification and Cause Extraction (DICE) in Multimodal Online PostsGopendra Vikram Singh, Soumitra Ghosh, Atul Verma, Chetna Painkra, Asif Ekbal. 4517-4532 [doi]

Out-of-Distribution Generalization in Natural Language Processing: Past, Present, and FutureLinyi Yang, Yaoxian Song, Xuan Ren, Chenyang Lyu, Yidong Wang, Jingming Zhuo, Lingqiao Liu, Jindong Wang 0001, Jennifer Foster, Yue Zhang 0004. 4533-4559 [doi]

Noisy Exemplars Make Large Language Models More Robust: A Domain-Agnostic Behavioral AnalysisHongyi Zheng, Abulhair Saparov. 4560-4568 [doi]

Can Large Language Models Capture Dissenting Human Voices?Noah Lee, Na An, James Thorne. 4569-4585 [doi]

DecoMT: Decomposed Prompting for Machine Translation Between Related Languages using Large Language ModelsRatish Puduppully, Anoop Kunchukuttan, Raj Dabre, Ai Ti Aw, Nancy Chen. 4586-4602 [doi]

Prototype-based HyperAdapter for Sample-Efficient Multi-task TuningHao Zhao, Jie Fu, Zhaofeng He. 4603-4615 [doi]

Towards Building More Robust NER datasets: An Empirical Study on NER Dataset Bias from a Dataset Difficulty ViewRuotian Ma, Xiaolei Wang, Xin Zhou, Qi Zhang, Xuanjing Huang. 4616-4630 [doi]

GradSim: Gradient-Based Language Grouping for Effective Multilingual TrainingMingyang Wang, Heike Adel, Lukas Lange, Jannik Strötgen, Hinrich Schütze. 4631-4646 [doi]

Discovering Universal Geometry in Embeddings with ICAHiroaki Yamagiwa, Momose Oyama, Hidetoshi Shimodaira. 4647-4675 [doi]

Toward a Critical Toponymy Framework for Named Entity Recognition: A Case Study of Airbnb in New York CityMikael Brunila, Jack LaViolette, Sky CH-Wang, Priyanka Verma, Clara Féré, Grant McKenzie. 4676-4695 [doi]

Well Begun is Half Done: Generator-agnostic Knowledge Pre-Selection for Knowledge-Grounded DialogueLang Qin, Yao Zhang, Hongru Liang, Jun Wang, Zhenglu Yang. 4696-4709 [doi]

Merging Generated and Retrieved Knowledge for Open-Domain QAYunxiang Zhang, Muhammad Khalifa, Lajanugen Logeswaran, Moontae Lee, Honglak Lee, Lu Wang 0008. 4710-4728 [doi]

Best of Both Worlds: Towards Improving Temporal Knowledge Base Question Answering via Targeted Fact ExtractionNithish Kannen, Udit Sharma, Sumit Neelam, Dinesh Khandelwal, Shajith Ikbal, Hima Karanam, L. Venkata Subramaniam. 4729-4744 [doi]

Text Fact TransferNishant Balepur, Jie Huang 0009, Kevin Chen-Chuan Chang. 4745-4764 [doi]

A Cheaper and Better Diffusion Language Model with Soft-Masked NoiseJiaao Chen, Aston Zhang, Mu Li 0003, Alex Smola, Diyi Yang. 4765-4775 [doi]

Mirages. On Anthropomorphism in Dialogue SystemsGavin Abercrombie, Amanda Cercas Curry, Tanvi Dinkar, Verena Rieser, Zeerak Talat. 4776-4790 [doi]

Cognitive Dissonance: Why Do Language Model Outputs Disagree with Internal Representations of Truthfulness?Kevin Liu, Stephen Casper, Dylan Hadfield-Menell, Jacob Andreas. 4791-4797 [doi]

KEBAP: Korean Error Explainable Benchmark Dataset for ASR and Post-processingSeonmin Koo, Chanjun Park, Jinsung Kim, Jaehyung Seo, Sugyeong Eo, Hyeonseok Moon, HeuiSeok Lim. 4798-4815 [doi]

Adaptive Policy with Wait-k Model for Simultaneous TranslationLibo Zhao, Kai Fan, Wei Luo, Jing Wu, Shushu Wang, Ziqian Zeng, Zhongqiang Huang. 4816-4832 [doi]

Cross-Document Event Coreference Resolution on Discourse StructureXinyu Chen, Sheng Xu 0006, Peifeng Li, Qiaoming Zhu. 4833-4843 [doi]

Post-hoc Utterance Refining Method by Entity Mining for Faithful Knowledge Grounded ConversationsYoonna Jang, Suhyune Son, JeongWoo Lee, Junyoung Son, Yuna Hur, Jungwoo Lim, Hyeonseok Moon, Kisu Yang, HeuiSeok Lim. 4844-4861 [doi]

Can We Edit Factual Knowledge by In-Context Learning?Ce Zheng, Lei Li, Qingxiu Dong, Yuxuan Fan, Zhiyong Wu, Jingjing Xu, Baobao Chang. 4862-4876 [doi]

EDIS: Entity-Driven Image Search over Multimodal Web ContentSiqi Liu, Weixi Feng, Tsu-Jui Fu, Wenhu Chen, William Wang. 4877-4894 [doi]

GQA: Training Generalized Multi-Query Transformer Models from Multi-Head CheckpointsJoshua Ainslie, James Lee-Thorp, Michiel de Jong, Yury Zemlyanskiy, Federico Lebrón, Sumit Sanghai. 4895-4901 [doi]

Towards a Mechanistic Interpretation of Multi-Step Reasoning Capabilities of Language ModelsYifan Hou, Jiaoda Li, Yu Fei, Alessandro Stolfo, Wangchunshu Zhou, Guangtao Zeng, Antoine Bosselut, Mrinmaya Sachan. 4902-4919 [doi]

BiasX: "Thinking Slow" in Toxic Content Moderation with Explanations of Implied Social BiasesYiming Zhang, Sravani Nanduri, Liwei Jiang, Tongshuang Wu, Maarten Sap. 4920-4932 [doi]

Text encoders bottleneck compositionality in contrastive vision-language modelsAmita Kamath, Jack Hessel, Kai-Wei Chang. 4933-4944 [doi]

Ignore This Title and HackAPrompt: Exposing Systemic Vulnerabilities of LLMs Through a Global Prompt Hacking CompetitionSander Schulhoff, Jeremy Pinto, Anaum Khan, Louis-François Bouchard, Chenglei Si, Svetlina Anati, Valen Tagliabue, Anson Liu Kost, Christopher Carnahan, Jordan L. Boyd-Graber. 4945-4977 [doi]

MMNMT: Modularizing Multilingual Neural Machine Translation with Flexibly Assembled MoE and Dense BlocksShangjie Li, Xiangpeng Wei, ShaoLin Zhu, Jun Xie, Baosong Yang, Deyi Xiong. 4978-4990 [doi]

Localizing Active Objects from Egocentric Vision with Symbolic World KnowledgeTe-Lin Wu, Yu Zhou, Nanyun Peng. 4991-5006 [doi]

Introducing Rhetorical Parallelism Detection: A New Task with Datasets, Metrics, and BaselinesStephen Bothwell, Justin DeBenedetto, Theresa Crnkovich, Hildegund Müller, David Chiang 0001. 5007-5039 [doi]

Prompting is not a substitute for probability measurements in large language modelsJennifer Hu, Roger Levy. 5040-5060 [doi]

Parameter-Efficient Language Model Tuning with Active Learning in Low-Resource SettingsJosip Jukic, Jan Snajder. 5061-5074 [doi]

Stop Uploading Test Data in Plain Text: Practical Strategies for Mitigating Data Contamination by Evaluation BenchmarksAlon Jacovi, Avi Caciularu, Omer Goldman, Yoav Goldberg. 5075-5084 [doi]

CoLT5: Faster Long-Range Transformers with Conditional ComputationJoshua Ainslie, Tao Lei, Michiel de Jong, Santiago Ontañón, Siddhartha Brahma, Yury Zemlyanskiy, David C. Uthus, Mandy Guo, James Lee-Thorp, Yi Tay, Yun-Hsuan Sung, Sumit Sanghai. 5085-5100 [doi]

DiSTRICT: Dialogue State Tracking with Retriever Driven In-Context TuningPraveen Venkateswaran, Evelyn Duesterwald, Vatche Isahagian. 5101-5112 [doi]

Cross-Cultural Analysis of Human Values, Morals, and Biases in Folk TalesWinston Wu, Lu Wang 0008, Rada Mihalcea. 5113-5125 [doi]

Non-Programmers Can Label Programs Indirectly via Active Examples: A Case Study with Text-to-SQLRuiqi Zhong, Charlie Snell, Dan Klein, Jason Eisner. 5126-5152 [doi]

LINC: A Neurosymbolic Approach for Logical Reasoning by Combining Language Models with First-Order Logic ProversTheo Olausson, Alex Gu, Benjamin Lipkin, Cedegao E. Zhang, Armando Solar-Lezama, Joshua B. Tenenbaum, Roger Levy. 5153-5176 [doi]

Non-autoregressive Streaming Transformer for Simultaneous TranslationZhengrui Ma, Shaolei Zhang, Shoutao Guo, Chenze Shao, Min Zhang, Yang Feng. 5177-5190 [doi]

ViSoBERT: A Pre-Trained Language Model for Vietnamese Social Media Text ProcessingNam Nguyen, Thang Phan, Duc-Vu Nguyen, Kiet Van Nguyen. 5191-5207 [doi]

RAPL: A Relation-Aware Prototype Learning Approach for Few-Shot Document-Level Relation ExtractionShiao Meng, Xuming Hu, Aiwei Liu, Shuang Li, Fukun Ma, YaWen Yang, Lijie Wen. 5208-5226 [doi]

GeoLM: Empowering Language Models for Geospatially Grounded Language UnderstandingZekun Li 0007, Wenxuan Zhou, Yao-Yi Chiang, Muhao Chen. 5227-5240 [doi]

Cross-Modal Conceptualization in Bottleneck ModelsDanis Alukaev, Semen Kiselev, Ilya Pershin, Bulat Ibragimov, Vladimir Ivanov, Alexey Kornaev, Ivan Titov. 5241-5253 [doi]

LLM-Adapters: An Adapter Family for Parameter-Efficient Fine-Tuning of Large Language ModelsZhiqiang Hu, Lei Wang, Yihuai Lan, Wanyu Xu, Ee-Peng Lim, Lidong Bing, Xing Xu 0001, Soujanya Poria, Roy Ka-Wei Lee. 5254-5276 [doi]

DREAM: Deployment of Recombination and Ensembles in Argument MiningFlorian Ruosch, Cristina Sarasua, Abraham Bernstein. 5277-5290 [doi]

MILDSum: A Novel Benchmark Dataset for Multilingual Summarization of Indian Legal Case JudgmentsDebtanu Datta, Shubham Soni, Rajdeep Mukherjee, Saptarshi Ghosh. 5291-5302 [doi]

Query Rewriting in Retrieval-Augmented Large Language ModelsXinbei Ma, Yeyun Gong, Pengcheng He, Hai Zhao, Nan Duan. 5303-5315 [doi]

PromptMix: A Class Boundary Augmentation Method for Large Language Model DistillationGaurav Sahu, Olga Vechtomova, Dzmitry Bahdanau, Issam H. Laradji. 5316-5327 [doi]

COHESENTIA: A Novel Benchmark of Incremental versus Holistic Assessment of Coherence in Generated TextsAviya Maimon, Reut Tsarfaty. 5328-5343 [doi]

QUDeval: The Evaluation of Questions Under Discussion Discourse ParsingYating Wu, Ritika Mangla, Greg Durrett, Junyi Jessy Li. 5344-5363 [doi]

PRCA: Fitting Black-Box Large Language Models for Retrieval Question Answering via Pluggable Reward-Driven Contextual AdapterHaoyan Yang, Zhitao Li, Yong Zhang, Jianzong Wang, Ning Cheng 0001, Ming Li, Jing Xiao 0006. 5364-5375 [doi]

Exploring Chain of Thought Style Prompting for Text-to-SQLChang-Yu Tai, Ziru Chen, Tianshu Zhang, Xiang Deng 0001, Huan Sun 0001. 5376-5393 [doi]

Efficient Algorithms for Recognizing Weighted Tree-Adjoining LanguagesAlexandra Butoi, Tim Vieira, Ryan Cotterell, David Chiang 0001. 5394-5416 [doi]

Harnessing Black-Box Control to Boost Commonsense in LM's GenerationYufei Tian, Felix Zhang, Nanyun Peng. 5417-5432 [doi]

Just Ask for Calibration: Strategies for Eliciting Calibrated Confidence Scores from Language Models Fine-Tuned with Human FeedbackKatherine Tian, Eric Mitchell, Allan Zhou, Archit Sharma, Rafael Rafailov, Huaxiu Yao, Chelsea Finn, Christopher D. Manning. 5433-5442 [doi]

Representative Demonstration Selection for In-Context Learning with Two-Stage Determinantal Point ProcessZhao Yang, Yuanzhe Zhang, Dianbo Sui, Cao Liu, Jun Zhao, Kang Liu. 5443-5456 [doi]

The Effect of Scaling, Retrieval Augmentation and Form on the Factual Consistency of Language ModelsLovisa Hagström, Denitsa Saynova, Tobias Norlund, Moa Johansson, Richard Johansson. 5457-5476 [doi]

ViPE: Visualise Pretty-much EverythingHassan Shahmohammadi, Adhiraj Ghosh, Hendrik P. A. Lensch. 5477-5494 [doi]

Semi-automatic Data Enhancement for Document-Level Relation Extraction with Distant Supervision from Large Language ModelsJunpeng Li, Zixia Jia, Zilong Zheng. 5495-5505 [doi]

Navigating the Grey Area: How Expressions of Uncertainty and Overconfidence Affect Language ModelsKaitlyn Zhou, Dan Jurafsky, Tatsunori Hashimoto. 5506-5524 [doi]

Elaborative Simplification as Implicit Questions Under DiscussionYating Wu, William Sheffield, Kyle Mahowald, Junyi Jessy Li. 5525-5537 [doi]

EntSUMv2: Dataset, Models and Evaluation for More Abstractive Entity-Centric SummarizationDhruv Mehra, Lingjue Xie, Ella Hofmann-Coyle, Mayank Kulkarni, Daniel Preotiuc-Pietro. 5538-5547 [doi]

SciRepEval: A Multi-Format Benchmark for Scientific Document RepresentationsAmanpreet Singh, Mike D'Arcy, Arman Cohan, Doug Downey, Sergey Feldman. 5548-5566 [doi]

A Diachronic Perspective on User Trust in AI under UncertaintyShehzaad Dhuliawala, Vilém Zouhar, Mennatallah El-Assady, Mrinmaya Sachan. 5567-5580 [doi]

CT-GAT: Cross-Task Generative Adversarial Attack based on TransferabilityMinxuan Lv, Chengwei Dai, Kun Li, Wei Zhou, Songlin Hu. 5581-5591 [doi]

Improving Long Document Topic Segmentation Models With Enhanced Coherence ModelingHai Yu, Chong Deng, Qinglin Zhang, Jiaqing Liu, Qian Chen, Wen Wang. 5592-5605 [doi]

Dialogue Chain-of-Thought Distillation for Commonsense-aware Conversational AgentsHyungjoo Chae, Yongho Song, Kai Tzu-iunn Ong, Taeyoon Kwon, Minjin Kim, Youngjae Yu, Dongha Lee, Dongyeop Kang, Jinyoung Yeo. 5606-5632 [doi]

Information Value: Measuring Utterance Predictability as Distance from Plausible AlternativesMario Giulianelli, Sarenne Wallbridge, Raquel Fernández. 5633-5653 [doi]

Generating Commonsense Counterfactuals for Stable Relation ExtractionXin Miao, Yongqi Li 0002, Tieyun Qian. 5654-5668 [doi]

C-STS: Conditional Semantic Textual SimilarityAmeet Deshpande, Carlos E. Jimenez, Howard Chen 0003, Vishvak Murahari, Victoria Graf, Tanmay Rajpurohit, Ashwin Kalyan, Danqi Chen, Karthik Narasimhan. 5669-5690 [doi]

Cross-lingual Transfer Can Worsen Bias in Sentiment AnalysisSeraphina Goldfarb-Tarrant, Björn Ross, Adam Lopez. 5691-5704 [doi]

Rumor Detection on Social Media with Crowd Intelligence and ChatGPT-Assisted NetworksChang Yang, Peng Zhang, Wenbo Qiao, Hui Gao, Jiaming Zhao. 5705-5717 [doi]

Grounding Visual Illusions in Language: Do Vision-Language Models Perceive Illusions Like Humans?Yichi Zhang, Jiayi Pan 0002, Yuchen Zhou, Rui Pan, Joyce Chai. 5718-5728 [doi]

Analysing State-Backed Propaganda Websites: a New Dataset and Linguistic StudyFreddy Heppell, Kalina Bontcheva, Carolina Scarton. 5729-5741 [doi]

Controllable Contrastive Generation for Multilingual Biomedical Entity LinkingTiantian Zhu, Yang Qin, Qingcai Chen, Xin Mu, Changlong Yu, Yang Xiang. 5742-5753 [doi]

HyperRouter: Towards Efficient Training and Inference of Sparse Mixture of ExpertsTruong Do, Le Khiem, Quang Pham, TrungTin Nguyen, Thanh-Nam Doan, Binh Nguyen, Chenghao Liu, Savitha Ramasamy, Xiaoli Li 0001, Steven C. H. Hoi. 5754-5765 [doi]

MediaHG: Rethinking Eye-catchy Features in Social Media Headline GenerationBoning Zhang, Yang Yang 0009. 5766-5777 [doi]

Fine-tuned LLMs Know More, Hallucinate Less with Few-Shot Sequence-to-Sequence Semantic Parsing over WikidataSilei Xu, Shicheng Liu, Theo Culhane, Elizaveta Pertseva, Meng-Hsi Wu, Sina J. Semnani, Monica S. Lam. 5778-5791 [doi]

ZEROTOP: Zero-Shot Task-Oriented Semantic Parsing using Large Language ModelsDheeraj Mekala, Jason Andrew Wolfe, Subhro Roy. 5792-5799 [doi]

Efficient Grammatical Error Correction Via Multi-Task Training and Optimized Training ScheduleAndrey Bout, Alexander Podolskiy, Sergey I. Nikolenko, Irina Piontkovskaya. 5800-5816 [doi]

The BLA Benchmark: Investigating Basic Language Abilities of Pre-Trained Multimodal ModelsXinyi Chen, Raquel Fernández, Sandro Pezzelle. 5817-5830 [doi]

RainProof: An Umbrella to Shield Text Generator from Out-Of-Distribution DataMaxime Darrin, Pablo Piantanida, Pierre Colombo. 5831-5857 [doi]

KEPL: Knowledge Enhanced Prompt Learning for Chinese Hypernym-Hyponym ExtractionNingchen Ma, Dong Wang, Hongyun Bao, Lei He, Suncong Zheng. 5858-5867 [doi]

Ditto: A Simple and Efficient Approach to Improve Sentence EmbeddingsQian Chen, Wen Wang, Qinglin Zhang, Siqi Zheng, Chong Deng, Hai Yu, Jiaqing Liu, Yukun Ma, Chong Zhang. 5868-5875 [doi]

Preserving Knowledge Invariance: Rethinking Robustness Evaluation of Open Information ExtractionJi Qi, Chuchun Zhang, Xiaozhi Wang, Kaisheng Zeng, Jifan Yu, Jinxin Liu, Lei Hou, Juanzi Li, Xu Bin. 5876-5890 [doi]

Why Should This Article Be Deleted? Transparent Stance Detection in Multilingual Wikipedia Editor DiscussionsLucie-Aimée Kaffee, Arnav Arora, Isabelle Augenstein. 5891-5909 [doi]

Fast and Robust Early-Exiting Framework for Autoregressive Language Models with Synchronized Parallel DecodingSangmin Bae, Jongwoo Ko, Hwanjun Song, Se-Young Yun. 5910-5924 [doi]

End-to-end Task-oriented Dialogue: A Survey of Tasks, Methods, and Future DirectionsLibo Qin 0001, Wenbo Pan, Qiguang Chen, Lizi Liao, Zhou Yu, Yue Zhang 0004, Wanxiang Che, Min Li. 5925-5941 [doi]

Answering Questions by Meta-Reasoning over Multiple Chains of ThoughtOri Yoran, Tomer Wolfson, Ben Bogin, Uri Katz, Daniel Deutch, Jonathan Berant. 5942-5966 [doi]

INSTRUCTSCORE: Towards Explainable Text Generation Evaluation with Automatic FeedbackWenda Xu, Danqing Wang, Liangming Pan, Zhenqiao Song, Markus Freitag, William Wang, Lei Li. 5967-5994 [doi]

Multi-level Contrastive Learning for Script-based Character UnderstandingDawei Li, Hengyuan Zhang, Yanran Li, Shiping Yang. 5995-6013 [doi]

CHEF in the Language Kitchen: A Generative Data Augmentation Leveraging Korean Morpheme IngredientsJaehyung Seo, Hyeonseok Moon, Jaewook Lee, Sugyeong Eo, Chanjun Park, HeuiSeok Lim. 6014-6029 [doi]

Automatic Debate Evaluation with Argumentation Semantics and Natural Language Argument Graph NetworksRamon Ruiz-Dolz, Stella Heras, Ana García-Fornes. 6030-6040 [doi]

Transfer-Free Data-Efficient Multilingual Slot LabelingEvgeniia Razumovskaia, Ivan Vulic, Anna Korhonen. 6041-6055 [doi]

Towards Interpretable Mental Health Analysis with Large Language ModelsKailai Yang, Shaoxiong Ji, Tianlin Zhang, Qianqian Xie, Ziyan Kuang, Sophia Ananiadou. 6056-6077 [doi]

Learning to Rank Generation with Pairwise Partial RewardsYoungwon Lee 0003, Jinu Lee, Seung-won Hwang. 6078-6092 [doi]

GreedyCAS: Unsupervised Scientific Abstract Segmentation with Normalized Mutual InformationYingqiang Gao, Jessica Lam, Nianlong Gu, Richard H. R. Hahnloser. 6093-6108 [doi]

Spoiler Detection as Semantic Text MatchingRyan Tran, Canwen Xu, Julian J. McAuley. 6109-6113 [doi]

Multimodal Embodied Plan Prediction Augmented with Synthetic Embodied DialogueAishwarya Padmakumar, Mert Inan, Spandana Gella, Patrick Lange, Dilek Hakkani-Tur. 6114-6131 [doi]

GEM: Gestalt Enhanced Markup Language Model for Web Understanding via Render TreeZirui Shao, Feiyu Gao, Zhongda Qi, Hangdi Xing, Jiajun Bu, Zhi Yu, Qi Zheng, Xiaozhong Liu. 6132-6145 [doi]

Abstractive Open Information ExtractionKevin Pei, Ishan Jindal, Kevin Chen-Chuan Chang. 6146-6158 [doi]

CoSyn: Detecting Implicit Hate Speech in Online Conversations Using a Context Synergized Hyperbolic NetworkSreyan Ghosh, Manan Suri, Purva Chiniya, Utkarsh Tyagi, Sonal Kumar, Dinesh Manocha. 6159-6173 [doi]

CLEME: Debiasing Multi-reference Evaluation for Grammatical Error CorrectionJingheng Ye, Yinghui Li, Qingyu Zhou, Yangning Li, Shirong Ma, Hai-Tao Zheng 0002, Ying Shen 0001. 6174-6189 [doi]

Dynamic Top-k Estimation Consolidates Disagreement between Feature Attribution MethodsJonathan Kamp, Lisa Beinborn, Antske Fokkens. 6190-6197 [doi]

SentiStream: A Co-Training Framework for Adaptive Online Sentiment Analysis in Evolving Data StreamsYuhao Wu, Karthick Sharma, Chun Seah, Shuhao Zhang 0001. 6198-6212 [doi]

HyperNetwork-based Decoupling to Improve Model Generalization for Few-Shot Relation ExtractionLiang Zhang, Chulun Zhou, Fandong Meng, Jinsong Su, Yidong Chen, Jie Zhou. 6213-6223 [doi]

Solving Hard Analogy Questions with Relation Embedding ChainsNitesh Kumar, Steven Schockaert. 6224-6236 [doi]

Modeling Empathic Similarity in Personal NarrativesJocelyn Shen, Maarten Sap, Pedro Colon-Hernandez, Hae Park, Cynthia Breazeal. 6237-6252 [doi]

Tree Prompting: Efficient Task Adaptation without Fine-TuningChandan Singh, John X. Morris, Alexander M. Rush, Jianfeng Gao, Yuntian Deng. 6253-6267 [doi]

Baize: An Open-Source Chat Model with Parameter-Efficient Tuning on Self-Chat DataCanwen Xu, Daya Guo, Nan Duan, Julian J. McAuley. 6268-6278 [doi]

Empathy Intent Drives Empathy DetectionLiting Jiang, Di Wu, Bohui Mao, Yanbing Li, Wushour Slamu. 6279-6290 [doi]

Adaptive End-to-End Metric Learning for Zero-Shot Cross-Domain Slot FillingYuanjun Shi, Linzhi Wu, Minglai Shao. 6291-6301 [doi]

BasahaCorpus: An Expanded Linguistic Resource for Readability Assessment in Central Philippine LanguagesJoseph Marvin Imperial, Ekaterina Kochmar. 6302-6309 [doi]

ReTAG: Reasoning Aware Table to Analytic Text GenerationDeepanway Ghosal, Preksha Nema, Aravindan Raghuveer. 6310-6324 [doi]

Beyond Factuality: A Comprehensive Evaluation of Large Language Models as Knowledge GeneratorsLiang Chen, Yang Deng, Yatao Bian, Zeyu Qin, Bingzhe Wu, Tat-Seng Chua, Kam-Fai Wong. 6325-6341 [doi]

Compressing Context to Enhance Inference Efficiency of Large Language ModelsYucheng Li 0001, Bo Dong, Frank Guerin, Chenghua Lin. 6342-6353 [doi]

MoT: Memory-of-Thought Enables ChatGPT to Self-ImproveXiaonan Li, Xipeng Qiu. 6354-6374 [doi]

4 and 7-bit Labeling for Projective and Non-Projective Dependency TreesCarlos Gómez-Rodríguez, Diego Roca, David Vilares 0001. 6375-6384 [doi]

Can You Follow Me? Testing Situational Understanding for ChatGPTChenghao Yang, Allyson Ettinger. 6385-6398 [doi]

Towards Reliable Misinformation Mitigation: Generalization, Uncertainty, and GPT-4Kellin Pelrine, Anne Imouza, Camille Thibault, Meilina Reksoprodjo, Caleb Gupta, Joel Christoph, Jean-François Godbout, Reihaneh Rabbany. 6399-6429 [doi]

Advancements in Arabic Grammatical Error Detection and Correction: An Empirical InvestigationBashar Alhafni, Go Inoue, Christian Khairallah, Nizar Habash. 6430-6448 [doi]

HaluEval: A Large-Scale Hallucination Evaluation Benchmark for Large Language ModelsJunyi Li, Xiaoxue Cheng, Xin Zhao, Jian-Yun Nie, Ji-Rong Wen. 6449-6464 [doi]

Enabling Large Language Models to Generate Text with CitationsTianyu Gao, Howard Yen, Jiatong Yu, Danqi Chen. 6465-6488 [doi]

Revisiting Machine Translation for Cross-lingual ClassificationMikel Artetxe, Vedanuj Goswami, Shruti Bhosale, Angela Fan, Luke Zettlemoyer. 6489-6499 [doi]

Pre-Trained Language Models Augmented with Synthetic Scanpaths for Natural Language UnderstandingShuwen Deng, Paul Prasse, David R. Reich, Tobias Scheffer, Lena A. Jäger. 6500-6507 [doi]

Counting the Bugs in ChatGPT's Wugs: A Multilingual Investigation into the Morphological Capabilities of a Large Language ModelLeonie Weissweiler, Valentin Hofmann, Anjali Kantharuban, Anna Cai, Ritam Dutt, Amey Hengle, Anubha Kabra, Atharva Kulkarni, Abhishek Vijayakumar, Haofei Yu, Hinrich Schütze, Kemal Oflazer, David R. Mortensen. 6508-6524 [doi]

Adapt in Contexts: Retrieval-Augmented Domain Adaptation via In-Context LearningQuanyu Long, Wenya Wang, Sinno Jialin Pan. 6525-6542 [doi]

Understanding the Inner-workings of Language Models Through Representation DissimilarityDavis Brown, Charles Godfrey, Nicholas Konz, Jonathan Tu, Henry Kvinge. 6543-6558 [doi]

Efficient Classification of Long Documents via State-Space ModelsPeng Lu, Suyuchen Wang, Mehdi Rezagholizadeh, Bang Liu, Ivan Kobyzev. 6559-6565 [doi]

Dual-Feedback Knowledge Retrieval for Task-Oriented Dialogue SystemsTianyuan Shi, LiangZhi Li, Zijian Lin, Tao Yang, Xiaojun Quan, Qifan Wang. 6566-6580 [doi]

Construction Artifacts in Metaphor Identification DatasetsJoanne Boisson, Luis Espinosa Anke, José Camacho-Collados. 6581-6590 [doi]

MAF: Multi-Aspect Feedback for Improving Reasoning in Large Language ModelsDeepak Nathani, David Wang, Liangming Pan, William Yang Wang. 6591-6616 [doi]

Granularity Matters: Pathological Graph-driven Cross-modal Alignment for Brain CT Report GenerationYanzhao Shi, Junzhong Ji, Xiaodan Zhang, Liangqiong Qu, Ying Liu. 6617-6630 [doi]

Enhancing Structured Evidence Extraction for Fact VerificationZirui Wu, Nan Hu, Yansong Feng. 6631-6641 [doi]

Rethinking Model Selection and Decoding for Keyphrase Generation with Pre-trained Sequence-to-Sequence ModelsDi Wu, Wasi Uddin Ahmad, Kai-Wei Chang. 6642-6658 [doi]

A Fair and In-Depth Evaluation of Existing End-to-End Entity Linking SystemsHannah Bast, Matthias Hertel, Natalie Prange. 6659-6672 [doi]

A Multi-Task Dataset for Assessing Discourse Coherence in Chinese Essays: Structure, Theme, and Logic AnalysisHongyi Wu, Xinshu Shen, Man Lan, Shaoguang Mao, Xiaopeng Bai, Yuanbin Wu. 6673-6688 [doi]

SKD-NER: Continual Named Entity Recognition via Span-based Knowledge Distillation with Reinforcement LearningYi Chen, Liang He. 6689-6700 [doi]

Lifelong Sequence Generation with Dynamic Module Expansion and AdaptationChengwei Qin, Chen Chen, Shafiq Joty. 6701-6714 [doi]

When the Majority is Wrong: Modeling Annotator Disagreement for Subjective TasksEve Fleisig, Rediet Abebe, Dan Klein. 6715-6726 [doi]

Lazy-k Decoding: Constrained Decoding for Information ExtractionArthur Hemmer, Mickaël Coustaty, Nicola Bartolo, Jérôme Brachat, Jean-Marc Ogier. 6727-6736 [doi]

Personalized Distillation: Empowering Open-Sourced LLMs with Adaptive Learning for Code GenerationHailin Chen, Amrita Saha, Steven Chu Hong Hoi, Shafiq Joty. 6737-6749 [doi]

Do Language Models Have a Common Sense regarding Time? Revisiting Temporal Commonsense Reasoning in the Era of Large Language ModelsRaghav Jain, Daivik Sojitra, Arkadeep Acharya, Sriparna Saha 0001, Adam Jatowt, Sandipan Dandapat. 6750-6774 [doi]

Comparing Styles across LanguagesShreya Havaldar, Matthew Pressimone, Eric Wong 0001, Lyle H. Ungar. 6775-6791 [doi]

Event Causality Extraction via Implicit Cause-Effect InteractionsJintao Liu, Zequn Zhang, Kaiwen Wei, Zhi Guo, Xian Sun, Li Jin, Xiaoyu Li. 6792-6804 [doi]

Evaluation of African American Language Bias in Natural Language GenerationNicholas Deas, Jessica Grieser, Shana Kleiner, Desmond Patton, Elsbeth Turcan, Kathleen R. McKeown. 6805-6824 [doi]

A Systematic Study of Performance Disparities in Multilingual Task-Oriented Dialogue SystemsSongbo Hu, Han Zhou, Moy Yuan, Milan Gritta, Guchun Zhang, Ignacio Iacobacci, Anna Korhonen, Ivan Vulic. 6825-6851 [doi]

Cognate Transformer for Automated Phonological Reconstruction and Cognate Reflex PredictionV. S. D. S. Mahesh Akavarapu, Arnab Bhattacharya 0001. 6852-6862 [doi]

Inference-Time Policy Adapters (IPA): Tailoring Extreme-Scale LMs without Fine-tuningXiming Lu, Faeze Brahman, Peter West, Jaehun Jung, Khyathi Chandu, Abhilasha Ravichander, Prithviraj Ammanabrolu, Liwei Jiang, Sahana Ramnath, Nouha Dziri, Jillian Fisher, Bill Lin, Skyler Hallinan, Lianhui Qin, Xiang Ren 0001, Sean Welleck, Yejin Choi 0001. 6863-6883 [doi]

Weakly Supervised Semantic Parsing with Execution-based Spurious Program FilteringKang Il Lee, Segwang Kim, Kyomin Jung. 6884-6894 [doi]

Taxonomy Expansion for Named Entity RecognitionKarthikeyan K, Yogarshi Vyas, Jie Ma, Giovanni Paolini, Neha Anna John, Shuai Wang, Yassine Benajiba, Vittorio Castelli, Dan Roth, Miguel Ballesteros. 6895-6906 [doi]

Rather a Nurse than a Physician - Contrastive Explanations under InvestigationOliver Eberle, Ilias Chalkidis, Laura Cabello, Stephanie Brandl. 6907-6920 [doi]

EtiCor: Corpus for Analyzing LLMs for EtiquettesAshutosh Dwivedi, Pradhyumna Lavania, Ashutosh Modi. 6921-6931 [doi]

An Investigation of LLMs' Inefficacy in Understanding Converse RelationsChengwen Qi, Bowen Li, Binyuan Hui, Bailin Wang, Jinyang Li, Jinwang Wu, Yuanjun Laili. 6932-6953 [doi]

Towards Low-Resource Automatic Program Repair with Meta-Learning and Pretrained Language ModelsWeishi Wang, Yue Wang 0034, Steven C. H. Hoi, Shafiq Joty. 6954-6968 [doi]

ZGUL: Zero-shot Generalization to Unseen Languages using Multi-source Ensembling of Language AdaptersRajdeep Dhingra Vipul Rathore, Mausam Parag Singla. 6969-6987 [doi]

Log-FGAER: Logic-Guided Fine-Grained Address Entity Recognition from Multi-Turn Spoken DialogueXue Han, Yitong Wang, Qian Hu, Pengwei Hu, Chao Deng, Junlan Feng. 6988-6997 [doi]

Unified Low-Resource Sequence Labeling by Sample-Aware Dynamic Sparse FinetuningSarkar Snigdha Sarathi Das, Haoran Zhang, Peng Shi, Wenpeng Yin 0001, Rui Zhang. 6998-7010 [doi]

On the Representational Capacity of Recurrent Neural Language ModelsFranz Nowak, Anej Svete, Li Du, Ryan Cotterell. 7011-7034 [doi]

A Mechanistic Interpretation of Arithmetic Reasoning in Language Models using Causal Mediation AnalysisAlessandro Stolfo, Yonatan Belinkov, Mrinmaya Sachan. 7035-7052 [doi]

Benchmarking and Improving Text-to-SQL Generation under AmbiguityAdithya Bhaskar, Tushar Tomar, Ashutosh Sathe, Sunita Sarawagi. 7053-7074 [doi]

Non-autoregressive Text Editing with Copy-aware Latent AlignmentsYu Zhang 0092, Yue Zhang 0004, Leyang Cui, Guohong Fu. 7075-7085 [doi]

Translating away Translationese without Parallel DataRricha Jalota, Koel Dutta Chowdhury, Cristina España-Bonet, Josef van Genabith. 7086-7100 [doi]

Prompt-Based Monte-Carlo Tree Search for Goal-oriented Dialogue Policy PlanningXiao Yu, Maximillian Chen, Zhou Yu. 7101-7125 [doi]

UniMath: A Foundational and Multimodal Mathematical ReasonerZhenwen Liang, Tianyu Yang, Jipeng Zhang, Xiangliang Zhang 0001. 7126-7133 [doi]

CaseEncoder: A Knowledge-enhanced Pre-trained Model for Legal Case EncodingYixiao Ma, Yueyue Wu, Weihang Su, Qingyao Ai, Yiqun Liu 0001. 7134-7143 [doi]

HiddenTables and PyQTax: A Cooperative Game and Dataset For TableQA to Ensure Scale and Data Privacy Across a Myriad of TaxonomiesWilliam Watson, Nicole Cho, Tucker Balch, Manuela Veloso. 7144-7159 [doi]

Causal Document-Grounded Dialogue Pre-trainingYingxiu Zhao, Bowen Yu 0002, Bowen Li, Haiyang Yu, Jinyang Li, Chao Wang, Fei Huang, Yongbin Li, Nevin L. Zhang. 7160-7174 [doi]

Accented Speech Recognition With Accent-specific CodebooksDarshan Prabhu, Preethi Jyothi, Sriram Ganapathy, Vinit Unni. 7175-7188 [doi]

Linking Surface Facts to Large-Scale Knowledge GraphsGorjan Radevski, Kiril Gashteovski, Chia-Chien Hung, Carolin Lawrence, Goran Glavas. 7189-7207 [doi]

Sentiment Analysis on Streaming User Reviews via Dual-Channel Dynamic Graph Neural NetworkXin Zhang, Linhai Zhang, Deyu Zhou. 7208-7220 [doi]

DUMB: A Dutch Model BenchmarkWietse de Vries, Martijn Wieling 0001, Malvina Nissim. 7221-7241 [doi]

OssCSE: Overcoming Surface Structure Bias in Contrastive Learning for Unsupervised Sentence EmbeddingZhan Shi, Guoyin Wang, Ke Bai 0001, Jiwei Li, Xiang Li, Qingjun Cui, Belinda Zeng, Trishul Chilimbi, Xiaodan Zhu. 7242-7254 [doi]

End-to-End Single-Channel Speaker-Turn Aware Conversational Speech TranslationJuan Pablo Zuluaga-Gomez, Zhaocheng Huang, Xing Niu, Rohit Paturi, Sundararajan Srinivasan, Prashant Mathur, Brian Thompson, Marcello Federico. 7255-7274 [doi]

A Fine-Grained Taxonomy of Replies to Hate SpeechXinchen Yu, Ashley Zhao, Eduardo Blanco 0002, Lingzi Hong. 7275-7289 [doi]

JointMatch: A Unified Approach for Diverse and Collaborative Pseudo-Labeling to Semi-Supervised Text ClassificationHenry Peng Zou, Cornelia Caragea. 7290-7301 [doi]

Simple Temporal Adaptation to Changing Label Sets: Hashtag Prediction via Dense KNNNiloofar Mireshghallah, Nikolai Vogler, Junxian He, Omar Florez, Ahmed El-Kishky, Taylor Berg-Kirkpatrick. 7302-7311 [doi]

Speak, Memory: An Archaeology of Books Known to ChatGPT/GPT-4Kent K. Chang, Mackenzie Cramer, Sandeep Soni, David Bamman. 7312-7327 [doi]

A Study on Accessing Linguistic Information in Pre-Trained Language Models by Using PromptsMarion Di Marco, Katharina Hämmerl, Alexander Fraser 0001. 7328-7336 [doi]

CiteBench: A Benchmark for Scientific Citation Text GenerationMartin Funkquist, Ilia Kuznetsov, Yufang Hou 0001, Iryna Gurevych. 7337-7353 [doi]

From Heuristic to Analytic: Cognitively Motivated Strategies for Coherent Physical Commonsense ReasoningZheyuan Zhang, Shane Storks, Fengyuan Hu, Sungryull Sohn, Moontae Lee, Honglak Lee, Joyce Chai. 7354-7379 [doi]

A Challenging Multimodal Video Summary: Simultaneously Extracting and Generating Keyframe-Caption Pairs from VideoKeito Kudo, Haruki Nagasawa, Jun Suzuki, Nobuyuki Shimizu. 7380-7402 [doi]

Effects of sub-word segmentation on performance of transformer language modelsJue Hou, Anisia Katinskaia, Anh-Duc Vu, Roman Yangarber. 7413-7425 [doi]

Symbolic Planning and Code Generation for Grounded DialogueJustin T. Chiu, Wenting Zhao, Derek Chen, Saujas Vaduguru, Alexander M. Rush, Daniel Fried. 7426-7436 [doi]

Universal Self-Adaptive PromptingXingchen Wan, Ruoxi Sun, Hootan Nakhost, Hanjun Dai, Julian Eisenschlos, Sercan Ö. Arik, Tomas Pfister. 7437-7462 [doi]

Somali Information Retrieval Corpus: Bridging the Gap between Query Translation and Dedicated Language ResourcesAbdisalam Badel, Ting Zhong, Wenxin Tai, Fan Zhou 0002. 7463-7469 [doi]

Beat LLMs at Their Own Game: Zero-Shot LLM-Generated Text Detection via Querying ChatGPTBiru Zhu, Lifan Yuan, Ganqu Cui, Yangyi Chen, Chong Fu, Bingxiang He, Yangdong Deng, Zhiyuan Liu, Maosong Sun 0001, Ming Gu 0001. 7470-7483 [doi]

Faithful Model Evaluation for Model-Based MetricsQian Hu, Palash Goyal, Rahul Gupta 0001. 7484-7489 [doi]

Content- and Topology-Aware Representation Learning for Scientific Multi-LiteratureKai Zhang, Kaisong Song, Yangyang Kang, Xiaozhong Liu. 7490-7502 [doi]

Language Model Quality Correlates with Psychometric Predictive Power in Multiple LanguagesEthan Wilcox, Clara Meister, Ryan Cotterell, Tiago Pimentel. 7503-7511 [doi]

Joint Entity and Relation Extraction with Span Pruning and Hypergraph Neural NetworksZhaohui Yan 0001, Songlin Yang, Wei Liu, Kewei Tu. 7512-7526 [doi]

Have LLMs Advanced Enough? A Challenging Problem Solving Benchmark For Large Language ModelsDaman Arora, Himanshu Gaurav Singh, Mausam. 7527-7543 [doi]

StrAE: Autoencoding for Pre-Trained Embeddings using Explicit StructureMattia Opper, Victor Prokhorov, Siddharth Narayanaswamy. 7544-7560 [doi]

WiCE: Real-World Entailment for Claims in WikipediaRyo Kamoi, Tanya Goyal, Juan Diego Rodriguez, Greg Durrett. 7561-7583 [doi]

Natural Disaster Tweets Classification Using Multimodal DataMohammad Basit, Bashir Alam, Zubaida Fatima, Salman Shaikh. 7584-7594 [doi]

On the Challenges of Using Black-Box APIs for Toxicity Evaluation in ResearchLuiza Pozzobon, Beyza Ermis, Patrick Lewis, Sara Hooker. 7595-7609 [doi]

RoBoCoP: A Comprehensive ROmance BOrrowing COgnate Package and Benchmark for Multilingual Cognate IdentificationLiviu P. Dinu, Ana Sabina Uban, Alina Maria Cristea, Anca Dinu, Ioan-Bogdan Iordache, Simona Georgescu, Laurentiu Zoicas. 7610-7629 [doi]

Instructive Dialogue Summarization with Query AggregationsBin Wang, Zhengyuan Liu, Nancy Chen. 7630-7653 [doi]

Semantic matching for text classification with complex class descriptionsBrian de Silva, Kuan-Wen Huang, Gwang Lee, Karen Hovsepian, Yan Xu, Mingwei Shen 0001. 7654-7680 [doi]

MADNet: Maximizing Addressee Deduction Expectation for Multi-Party Conversation GenerationJia-Chen Gu, Chao-Hong Tan, Caiyuan Chu, Zhen-Hua Ling, Chongyang Tao, Quan Liu, Cong Liu. 7681-7692 [doi]

GLEN: Generative Retrieval via Lexical Index LearningSunkyung Lee 0001, Minjin Choi 0001, Jongwuk Lee. 7693-7704 [doi]

Turn-Level Active Learning for Dialogue State TrackingZihan Zhang, Meng Fang, Fanghua Ye 0001, Ling Chen, Mohammad-Reza Namazi-Rad. 7705-7719 [doi]

ReSee: Responding through Seeing Fine-grained Visual Knowledge in Open-domain DialogueHaoqin Tu, Yitong Li, Fei Mi, Zhongliang Yang. 7720-7735 [doi]

Modeling Conceptual Attribute Likeness and Domain Inconsistency for Metaphor DetectionYuan Tian, Nan Xu, Wenji Mao, Daniel Zeng 0001. 7736-7752 [doi]

Referring Image Segmentation via Joint Mask Contextual Embedding Learning and Progressive Alignment NetworkZiling Huang, Shin'ichi Satoh 0001. 7753-7762 [doi]

Shall We Pretrain Autoregressive Language Models with Retrieval? A Comprehensive StudyBoxin Wang, Wei Ping, Peng Xu, Lawrence McAfee, Zihan Liu, Mohammad Shoeybi, Yi Dong, Oleksii Kuchaiev, Bo Li, Chaowei Xiao, Anima Anandkumar, Bryan Catanzaro. 7763-7786 [doi]

SCITAB: A Challenging Benchmark for Compositional Reasoning and Claim Verification on Scientific TablesXinyuan Lu, Liangming Pan, Qian Liu, Preslav Nakov, Min-Yen Kan. 7787-7813 [doi]

Training Simultaneous Speech Translation with Robust and Random Wait-k-Tokens StrategyLinlin Zhang, Kai Fan, Jiajun Bu, Zhongqiang Huang. 7814-7831 [doi]

SCENE: Self-Labeled Counterfactuals for Extrapolating to Negative ExamplesDeqing Fu, Ameya Godbole, Robin Jia. 7832-7848 [doi]

Enhancing Code-Switching for Cross-lingual SLU: A Unified View of Semantic and Grammatical CoherenceZhihong Zhu, Xuxin Cheng, Zhiqi Huang, Dongsheng Chen, Yuexian Zou. 7849-7856 [doi]

Task-Agnostic Low-Rank Adapters for Unseen English DialectsZedian Xiao, William Held, Yanchen Liu, Diyi Yang. 7857-7870 [doi]

Federated Learning of Large Language Models with Parameter-Efficient Prompt Tuning and Adaptive OptimizationTianshi Che, Ji Liu, Yang Zhou 0001, Jiaxiang Ren 0001, Jiwen Zhou, Victor S. Sheng, Huaiyu Dai, Dejing Dou. 7871-7888 [doi]

TheoremQA: A Theorem-driven Question Answering DatasetWenhu Chen, Ming Yin, Max Ku, Pan Lu, Yixin Wan, Xueguang Ma, Jianyu Xu, Xinyi Wang, Tony Xia. 7889-7901 [doi]

Scalable-DSC: A Structural Template Prompt Approach to Scalable Dialogue State CorrectionHaoxiang Su, Hongyan Xie, Hao Huang, Shuangyong Song, Ruiyu Fang, Xiaomeng Huang, Sijie Feng. 7902-7914 [doi]

Don't Trust ChatGPT when your Question is not in English: A Study of Multilingual Abilities and Types of LLMsXiang Zhang, Senyu Li, Bradley Hauer, Ning Shi, Grzegorz Kondrak. 7915-7927 [doi]

M³Seg: A Maximum-Minimum Mutual Information Paradigm for Unsupervised Topic Segmentation in ASR TranscriptsKe Wang, Xiutian Zhao, Yanghui Li, Wei Peng. 7928-7934 [doi]

Empirical Study of Zero-Shot NER with ChatGPTTingyu Xie, Qi Li, Jian Zhang, Yan Zhang, Zuozhu Liu, Hongwei Wang. 7935-7956 [doi]

Automatic Prompt Optimization with "Gradient Descent" and Beam SearchReid Pryzant, Dan Iter, Jerry Li 0001, Yin Tat Lee, Chenguang Zhu 0001, Michael Zeng 0001. 7957-7968 [doi]

Active Retrieval Augmented GenerationZhengbao Jiang, Frank F. Xu, Luyu Gao, Zhiqing Sun, Qian Liu, Jane Dwivedi-Yu, Yiming Yang, Jamie Callan, Graham Neubig. 7969-7992 [doi]

GD-COMET: A Geo-Diverse Commonsense Inference ModelMehar Bhatia, Vered Shwartz. 7993-8001 [doi]

Multi-level Adaptive Contrastive Learning for Knowledge Internalization in Dialogue GenerationChenxu Yang, Zheng Lin, Lanrui Wang, Chong Tian, Liang Pang, Jiangnan Li, Qirong Ho, Yanan Cao, Weiping Wang. 8002-8015 [doi]

Enhancing Biomedical Lay Summarisation with External Knowledge GraphsTomas Goldsack, Zhihao Zhang, Chen Tang, Carolina Scarton, Chenghua Lin. 8016-8032 [doi]

A Diffusion Weighted Graph Framework for New Intent DiscoveryWenkai Shi, Wenbin An, Feng Tian, Qinghua Zheng, QianYing Wang, Ping Chen. 8033-8042 [doi]

A Self-enhancement Multitask Framework for Unsupervised Aspect Category DetectionThi-Nhung Nguyen, Hoang Ngo, Kiem-Hieu Nguyen, Tuan-Dung Cao. 8043-8054 [doi]

DialCoT Meets PPO: Decomposing and Exploring Reasoning Paths in Smaller Language ModelsChengcheng Han 0004, Xiaowei Du, Che Zhang, Yixin Lian, Xiang Li, Ming Gao, Baoyuan Wang. 8055-8068 [doi]

Recurrent Neural Language Models as Probabilistic Finite-state AutomataAnej Svete, Ryan Cotterell. 8069-8086 [doi]

Revisiting Source Context in Nearest Neighbor Machine TranslationXuanhong Li, Peng Li, Po Hu. 8087-8098 [doi]

Find-2-Find: Multitask Learning for Anaphora Resolution and Object LocalizationCennet Oguz, Pascal Denis, Emmanuel Vincent 0001, Simon Ostermann 0002, Josef van Genabith. 8099-8110 [doi]

Background Summarization of Event TimelinesAdithya Pratapa, Kevin Small, Markus Dreyer. 8111-8136 [doi]

Superlim: A Swedish Language Understanding Evaluation BenchmarkAleksandrs Berdicevskis, Gerlof Bouma, Robin Kurtz, Felix Morger, Joey Öhman, Yvonne Adesam, Lars Borin, Dana Dannélls, Markus Forsberg, Tim Isbister, Anna Lindahl, Martin Malmsten, Faton Rekathati, Magnus Sahlgren, Elena Volodina, Love Börjeson, Simon Hengchen, Nina Tahmasebi. 8137-8153 [doi]

Reasoning with Language Model is Planning with World ModelShibo Hao, Yi Gu, Haodi Ma, Joshua Jiahua Hong, Zhen Wang, Daisy Zhe Wang, Zhiting Hu. 8154-8173 [doi]

LLM-enhanced Self-training for Cross-domain Constituency ParsingJianling Li, Meishan Zhang, Peiming Guo, Min Zhang, Yue Zhang. 8174-8185 [doi]

Continual Named Entity Recognition without Catastrophic ForgettingDuzhen Zhang, Wei Cong, Jiahua Dong, Yahan Yu, Xiuyi Chen, Yonggang Zhang, Zhen Fang. 8186-8197 [doi]

DSI++: Updating Transformer Memory with New DocumentsSanket Vaibhav Mehta, Jai Gupta, Yi Tay, Mostafa Dehghani 0001, Vinh Q. Tran, Jinfeng Rao, Marc Najork, Emma Strubell, Donald Metzler. 8198-8213 [doi]

Editing Common Sense in TransformersAnshita Gupta, Debanjan Mondal, Akshay Krishna Sheshadri, Wenlong Zhao 0001, Xiang Li 0069, Sarah Wiegreffe, Niket Tandon. 8214-8232 [doi]

Air-Decoding: Attribute Distribution Reconstruction for Decoding-Time Controllable Text GenerationTianqi Zhong, Quan Wang, Jingxuan Han, Yongdong Zhang 0001, Zhendong Mao. 8233-8248 [doi]

Homophone Disambiguation Reveals Patterns of Context Mixing in Speech TransformersHosein Mohebbi, Grzegorz Chrupala, Willem H. Zuidema, Afra Alishahi. 8249-8260 [doi]

Retrieval-Generation Alignment for End-to-End Task-Oriented Dialogue SystemWeizhou Shen, Yingqi Gao, Canbin Huang, Fanqi Wan, Xiaojun Quan, Wei Bi. 8261-8275 [doi]

IfQA: A Dataset for Open-domain Question Answering under Counterfactual PresuppositionsWenhao Yu 0002, Meng Jiang 0001, Peter Clark, Ashish Sabharwal. 8276-8288 [doi]

How Do Large Language Models Capture the Ever-changing World Knowledge? A Review of Recent AdvancesZihan Zhang, Meng Fang, Ling Chen, Mohammad-Reza Namazi-Rad, Jun Wang. 8289-8311 [doi]

PreWoMe: Exploiting Presuppositions as Working Memory for Long Form Question AnsweringWookje Han, Jinsol Park, Kyungjae Lee 0002. 8312-8322 [doi]

Memorisation Cartography: Mapping out the Memorisation-Generalisation Continuum in Neural Machine TranslationVerna Dankers, Ivan Titov, Dieuwke Hupkes. 8323-8343 [doi]

DecipherPref: Analyzing Influential Factors in Human Preference Judgments via GPT-4Yebowen Hu, Kaiqiang Song, Sangwoo Cho, Xiaoyang Wang, Hassan Foroosh, Fei Liu 0004. 8344-8357 [doi]

Gender Biases in Automatic Evaluation Metrics for Image CaptioningHaoyi Qiu, Zi-Yi Dou, Tianlu Wang, Asli Celikyilmaz, Nanyun Peng. 8358-8375 [doi]

QA-NatVer: Question Answering for Natural Logic-based Fact VerificationRami Aly, Marek Strong, Andreas Vlachos 0001. 8376-8391 [doi]

Increasing Probability Mass on Answer Choices Does Not Always Improve AccuracySarah Wiegreffe, Matthew Finlayson, Oyvind Tafjord, Peter Clark, Ashish Sabharwal. 8392-8417 [doi]

Generating Data for Symbolic Language with Large Language ModelsJiacheng Ye, Chengzu Li, Lingpeng Kong, Tao Yu 0009. 8418-8443 [doi]

IDTraffickers: An Authorship Attribution Dataset to link and connect Potential Human-Trafficking Operations on Text Escort AdvertisementsVageesh Saxena, Benjamin Bashpole, Gijs van Dijck, Gerasimos Spanakis. 8444-8464 [doi]

Evaluating Bias and Fairness in Gender-Neutral Pretrained Vision-and-Language ModelsLaura Cabello, Emanuele Bugliarello, Stephanie Brandl, Desmond Elliott. 8465-8483 [doi]

Improving Dialogue Discourse Parsing via Reply-to Structures of Addressee RecognitionYaxin Fan, Feng Jiang, Peifeng Li, Fang Kong 0001, Qiaoming Zhu. 8484-8495 [doi]

Improving Language Models' Meaning Understanding and Consistency by Learning Conceptual Roles from DictionaryMyeongjun Jang, Thomas Lukasiewicz. 8496-8510 [doi]

DALE: Generative Data Augmentation for Low-Resource Legal NLPSreyan Ghosh, Chandra Kiran Reddy Evuru, Sonal Kumar, Ramaneswaran S, S. Sakshi, Utkarsh Tyagi, Dinesh Manocha. 8511-8565 [doi]

FedID: Federated Interactive Distillation for Large-Scale Pretraining Language ModelsXinge Ma, Jiangming Liu, Jin Wang 0008, Xuejie Zhang 0002. 8566-8577 [doi]

trlX: A Framework for Large Scale Reinforcement Learning from Human FeedbackAlexander Havrilla, Maksym Zhuravinskyi, Duy Phung, Aman Tiwari, Jonathan Tow, Stella Biderman, Quentin Anthony, Louis Castricato. 8578-8595 [doi]

This is not a Dataset: A Large Negation Benchmark to Challenge Large Language ModelsIker García-Ferrero, Begoña Altuna, Javier Álvez, Itziar Gonzalez-Dios, German Rigau. 8596-8615 [doi]

MT2: Towards a Multi-Task Machine Translation Model with Translation-Specific In-Context LearningChunyou Li, Mingtong Liu, Hongxiao Zhang, Yufeng Chen 0005, Jinan Xu, Ming Zhou. 8616-8627 [doi]

CleanCoNLL: A Nearly Noise-Free Named Entity Recognition DatasetSusanna Rücker, Alan Akbik. 8628-8645 [doi]

Disentangling Transformer Language Models as Superposed Topic ModelsJia Lim, Hady Lauw. 8646-8666 [doi]

Conversational Semantic Parsing using Dynamic Context GraphsParag Jain, Mirella Lapata. 8667-8679 [doi]

Not all quantifiers are equal: Probing Transformer-based language models' understanding of generalised quantifiersTharindu Madusanka, Iqra Zahid, Hao Li, Ian Pratt-Hartmann, Riza Batista-Navarro. 8680-8692 [doi]

Structure-aware Knowledge Graph-to-text Generation with Planning Selection and Similarity DistinctionFeng Zhao 0003, Hongzhi Zou, Cheng Yan. 8693-8703 [doi]

SOUL: Towards Sentiment and Opinion Understanding of LanguageYue Deng 0010, Wenxuan Zhang, Sinno Jialin Pan, Lidong Bing. 8704-8711 [doi]

Regulation and NLP (RegNLP): Taming Large Language ModelsCatalina Goanta, Nikolaos Aletras, Ilias Chalkidis, Sofia Ranchordás, Gerasimos Spanakis. 8712-8724 [doi]

MedEval: A Multi-Level, Multi-Task, and Multi-Domain Medical Benchmark for Language Model EvaluationZexue He, Yu Wang, An Yan 0003, Yao Liu, Eric Y. Chang, Amilcare Gentili, Julian J. McAuley, Chun-Nan Hsu. 8725-8744 [doi]

Seeing through the mess: evolutionary dynamics of lexical polysemyAndreas Baumann, Andreas Stephan, Benjamin Roth 0001. 8745-8762 [doi]

Are Embedded Potatoes Still Vegetables? On the Limitations of WordNet Embeddings for Lexical SemanticsXuyou Cheng, Michael Schlichtkrull, Guy Emerson. 8763-8775 [doi]

Evaluation Metrics in the Era of GPT-4: Reliably Evaluating Large Language Models on Sequence to Sequence TasksAndrea Sottana, Bin Liang, Kai Zou, Zheng Yuan. 8776-8788 [doi]

Event-Location Tracking in Narratives: A Case Study on Holocaust TestimoniesEitan Wagner, Renana Keydar, Omri Abend. 8789-8805 [doi]

Dialogizer: Context-aware Conversational-QA Dataset Generation from Textual SourcesYerin Hwang, Yongil Kim, Hyunkyung Bae, Hwanhee Lee, Jeesoo Bang, Kyomin Jung. 8806-8828 [doi]

Learning to Predict Task Transferability via Soft PromptLingyun Feng. 8829-8844 [doi]

Chain-of-Questions Training with Latent Answers for Robust Multistep Question AnsweringWang Zhu 0001, Jesse Thomason, Robin Jia. 8845-8860 [doi]

Mirror: A Universal Framework for Various Information Extraction TasksTong Zhu 0002, Junfei Ren, Zijian Yu, Mengsong Wu, Guoliang Zhang, Xiaoye Qu, Wenliang Chen, Zhefeng Wang, Baoxing Huai, Min Zhang. 8861-8876 [doi]

"Mistakes Help Us Grow": Facilitating and Evaluating Growth Mindset Supportive Language in ClassroomsKunal Handa, Margaret Clapper, Jessica Boyle, Rose E. Wang, Diyi Yang, David S. Yeager, Dorottya Demszky. 8877-8897 [doi]

Unnatural Error Correction: GPT-4 Can Almost Perfectly Handle Unnatural Scrambled TextQi Cao, Takeshi Kojima, Yutaka Matsuo, Yusuke Iwasawa. 8898-8913 [doi]

Detecting and Mitigating Hallucinations in Multilingual SummarisationYifu Qiu, Yftah Ziser, Anna Korhonen, Edoardo Maria Ponti, Shay B. Cohen. 8914-8932 [doi]

Exploring Linguistic Probes for Morphological InflectionJordan Kodner, Salam Khalifa, Sarah Ruth Brogden Payne. 8933-8941 [doi]

AMR Parsing with Causal Hierarchical Attention and PointersChao Lou, Kewei Tu. 8942-8955 [doi]

FLatS: Principled Out-of-Distribution Detection with Feature-Based Likelihood Ratio ScoreHaowei Lin, Yuntian Gu. 8956-8963 [doi]

Self-Evolution Learning for Mixup: Enhance Data Augmentation on Few-Shot Text Classification TasksHaoqi Zheng, Qihuang Zhong, Liang Ding 0006, Zhiliang Tian, Xin Niu, Changjian Wang, Dongsheng Li 0001, Dacheng Tao. 8964-8974 [doi]

IC3: Image Captioning by Committee ConsensusDavid Chan, Austin Myers, Sudheendra Vijayanarasimhan, David A. Ross, John F. Canny. 8975-9003 [doi]

SelfCheckGPT: Zero-Resource Black-Box Hallucination Detection for Generative Large Language ModelsPotsawee Manakul, Adian Liusie, Mark J. F. Gales. 9004-9017 [doi]

Fair Without Leveling Down: A New Intersectional Fairness DefinitionGaurav Maheshwari 0004, Aurélien Bellet, Pascal Denis, Mikaela Keller. 9018-9032 [doi]

Revisiting Instruction Fine-tuned Model Evaluation to Guide Industrial ApplicationsManuel Faysse, Gautier Viaud, Céline Hudelot, Pierre Colombo. 9033-9048 [doi]

CLAD-ST: Contrastive Learning with Adversarial Data for Robust Speech TranslationSathish Indurthi, Shamil Chollampatt, Ravi Agrawal, Marco Turchi. 9049-9056 [doi]

M2DF: Multi-grained Multi-curriculum Denoising Framework for Multimodal Aspect-based Sentiment AnalysisFei Zhao, Chunhui Li, Zhen Wu, Yawen Ouyang, Jianbing Zhang, Xinyu Dai. 9057-9070 [doi]

Detection of Multiple Mental Disorders from Social Media with Two-Stream Psychiatric ExpertsSiyuan Chen, Zhiling Zhang, Mengyue Wu, Kenny Q. Zhu. 9071-9084 [doi]

Understanding the Role of Input Token Characters in Language Models: How Does Information Loss Affect Performance?Ahmed Alajrami, Katerina Margatina, Nikolaos Aletras. 9085-9108 [doi]

Improved Unsupervised Chinese Word Segmentation Using Pre-trained Knowledge and Pseudo-labeling TransferHsiu-Wen Li, Ying-Jia Lin, Yi-Ting Li, Chun Lin, Hung-Yu Kao. 9109-9118 [doi]

EasyQuant: An Efficient Data-free Quantization Algorithm for LLMsHanlin Tang, Yifu Sun, Decheng Wu, Kai Liu, Jianchen Zhu, Zhanhui Kang. 9119-9128 [doi]

Polar Ducks and Where to Find Them: Enhancing Entity Linking with Duck Typing and Polar Box EmbeddingsMattia Atzeni, Mikhail Plekhanov, Frédéric Dreyer, Nora Kassner, Simone Merello, Louis Martin, Nicola Cancedda. 9129-9146 [doi]

APrompt: Attention Prompt Tuning for Efficient Adaptation of Pre-trained Language ModelsQifan Wang, Yuning Mao, Jingang Wang, Hanchao Yu, Shaoliang Nie, Sinong Wang, Fuli Feng, Lifu Huang, Xiaojun Quan, Zenglin Xu, Dongfang Liu. 9147-9160 [doi]

What's "up" with vision-language models? Investigating their struggle with spatial reasoningAmita Kamath, Jack Hessel, Kai-Wei Chang. 9161-9175 [doi]

IBADR: an Iterative Bias-Aware Dataset Refinement Framework for Debiasing NLU modelsXiaoyue Wang, Xin Liu, Lijie Wang, Yaoxiang Wang, Jinsong Su, Hua Wu 0003. 9176-9186 [doi]

Learning Preference Model for LLMs via Automatic Preference Data GenerationShijia Huang, Jianqiao Zhao, Yanyang Li, Liwei Wang 0009. 9187-9199 [doi]

Multilingual k-Nearest-Neighbor Machine TranslationDavid Stap, Christof Monz. 9200-9208 [doi]

Understanding Computational Models of Semantic Change: New Insights from the Speech CommunityFilip Miletic 0002, Anne Przewozny-Desriaux, Ludovic Tanguy. 9209-9220 [doi]

Causal Reasoning through Two Cognition Layers for Improving Generalization in Visual Question AnsweringTrang Nguyen, Naoaki Okazaki. 9221-9236 [doi]

StructGPT: A General Framework for Large Language Model to Reason over Structured DataJinhao Jiang, Kun Zhou, Zican Dong, Keming Ye, Xin Zhao, Ji-Rong Wen. 9237-9251 [doi]

Modeling Legal Reasoning: LM Annotation at the Edge of Human AgreementRosamond Elizabeth Thalken, Edward H. Stiglitz, David Mimno, Matthew Wilkens. 9252-9265 [doi]

Model-tuning Via Prompts Makes NLP Models Adversarially RobustMrigank Raman, Pratyush Maini, J. Zico Kolter, Zachary C. Lipton, Danish Pruthi. 9266-9286 [doi]

Learning Co-Speech Gesture for Multimodal Aphasia Type DetectionDaeun Lee, Sejung Son, Hyolim Jeon, Seungbae Kim, Jinyoung Han. 9287-9303 [doi]

STINMatch: Semi-Supervised Semantic-Topological Iteration Network for Financial Risk Detection via News Label DiffusionXurui Li, Yue Qin, Rui Zhu, Tianqianjin Lin, Yongming Fan, Yangyang Kang, Kaisong Song, Fubang Zhao, Changlong Sun, Haixu Tang, Xiaozhong Liu. 9304-9315 [doi]

Centering the Margins: Outlier-Based Identification of Harmed Populations in Toxicity DetectionVyoma Raman, Eve Fleisig, Dan Klein. 9316-9329 [doi]

Describe Me an Auklet: Generating Grounded Perceptual Category DescriptionsBill Noble, Nikolai Ilinykh. 9330-9347 [doi]

Revisiting Automated Topic Model Evaluation with Large Language ModelsDominik Stammbach, Vilém Zouhar, Alexander Hoyle, Mrinmaya Sachan, Elliott Ash. 9348-9357 [doi]

ORCHID: A Chinese Debate Corpus for Target-Independent Stance Detection and Argumentative Dialogue SummarizationXiutian Zhao, Ke Wang, Wei Peng. 9358-9375 [doi]

On the Benefits of Learning to Route in Mixture-of-Experts ModelsNishanth Dikkala, Nikhil Ghosh, Raghu Meka, Rina Panigrahy, Nikhil Vyas 0001, Xin Wang 0016. 9376-9396 [doi]

SEAHORSE: A Multilingual, Multifaceted Dataset for Summarization EvaluationElizabeth Clark, Shruti Rijhwani, Sebastian Gehrmann, Joshua Maynez, Roee Aharoni, Vitaly Nikolaev, Thibault Sellam, Aditya Siddhant, Dipanjan Das 0001, Ankur P. Parikh. 9397-9413 [doi]

Query2doc: Query Expansion with Large Language ModelsLiang Wang, Nan Yang, Furu Wei. 9414-9423 [doi]

We Need to Talk About Reproducibility in NLP Model ComparisonYan Xue, Xuefei Cao, Xingli Yang, Yu Wang 0092, Ruibo Wang, Jihong Li. 9424-9434 [doi]

Explore-Instruct: Enhancing Domain-Specific Instruction Coverage through Active ExplorationFanqi Wan, Xinting Huang, Tao Yang, Xiaojun Quan, Wei Bi, Shuming Shi 0001. 9435-9454 [doi]

Practical Computational Power of Linear Transformers and Their Recurrent and Self-Referential ExtensionsKazuki Irie, Róbert Csordás, Jürgen Schmidhuber. 9455-9465 [doi]

InterFair: Debiasing with Natural Language Feedback for Fair Interpretable PredictionsBodhisattwa Prasad Majumder, Zexue He, Julian J. McAuley. 9466-9471 [doi]

Just Adjust One Prompt: Enhancing In-Context Dialogue Scoring via Constructing the Optimal Subgraph of Demonstrations and PromptsJiashu Pu, Ling Cheng, Lu Fan, Tangjie Lv, Rongsheng Zhang. 9472-9496 [doi]

Multilingual estimation of political-party positioning: From label aggregation to long-input TransformersDmitry Nikolaev 0003, Tanise Ceron, Sebastian Padó. 9497-9511 [doi]

ART: rule bAsed futuRe-inference deducTionMengze Li 0001, Tianqi Zhao, Jionghao Bai, Baoyi He, Jiaxu Miao, Wei Ji, Zheqi Lv, Zhou Zhao, Shengyu Zhang, Wenqiao Zhang, Fei Wu. 9512-9522 [doi]

EpiK-Eval: Evaluation for Language Models as Epistemic ModelsGabriele Prato, Jerry Huang, Prasanna Parthasarathi, Shagun Sodhani, Sarath Chandar. 9523-9557 [doi]

From Dissonance to Insights: Dissecting Disagreements in Rationale Construction for Case Outcome ClassificationShanshan Xu, Santosh T. y. s. s, Oana Ichim, Isabella Risini, Barbara Plank, Matthias Grabmair. 9558-9576 [doi]

On Bilingual Lexicon Induction with Large Language ModelsYaoyiran Li, Anna Korhonen, Ivan Vulic. 9577-9599 [doi]

Statistical Depth for Ranking and Characterizing Transformer-Based Text EmbeddingsParker Seegmiller, Sarah Preum. 9600-9611 [doi]

CRaSh: Clustering, Removing, and Sharing Enhance Fine-tuning without Full Large Language ModelKaiyan Zhang, Ning Ding, Biqing Qi, Xuekai Zhu, Xinwei Long, Bowen Zhou. 9612-9637 [doi]

From Multilingual Complexity to Emotional Clarity: Leveraging Commonsense to Unveil Emotions in Code-Mixed DialoguesShivani Kumar, Ramaneswaran S, Md. Shad Akhtar, Tanmoy Chakraborty 0002. 9638-9652 [doi]

Large Language Models are biased to overestimate profoundnessEugenio Herrera-Berg, Tomás Vergara Browne, Pablo León-Villagrá, Marc-Lluís Vives, Cristian Buc Calderon. 9653-9661 [doi]

SummEdits: Measuring LLM Ability at Factual Reasoning Through The Lens of SummarizationPhilippe Laban, Wojciech Kryscinski, Divyansh Agarwal, Alexander R. Fabbri, Caiming Xiong, Shafiq Joty, Chien-Sheng Wu. 9662-9676 [doi]

DIVE: Towards Descriptive and Diverse Visual Commonsense GenerationJun-Hyung Park, Hyuntae Park, Youjin Kang, Eojin Jeon, SangKeun Lee 0001. 9677-9695 [doi]

Towards Conceptualization of "Fair Explanation": Disparate Impacts of anti-Asian Hate Speech Explanations on Content ModeratorsTin Nguyen 0005, Jiannan Xu, Aayushi Roy, Hal Daumé III, Marine Carpuat. 9696-9717 [doi]

Bridging Background Knowledge Gaps in Translation with Automatic ExplicitationHyoJung Han, Jordan L. Boyd-Graber, Marine Carpuat. 9718-9735 [doi]

A Quality-based Syntactic Template Retriever for Syntactically-Controlled Paraphrase GenerationXue Zhang, Songming Zhang, Yunlong Liang, Yufeng Chen 0005, Jian Liu, Wenjuan Han, Jinan Xu. 9736-9748 [doi]

Beyond Shared Vocabulary: Increasing Representational Word Similarities across Languages for Multilingual Machine TranslationDi Wu, Christof Monz. 9749-9764 [doi]

Quantifying the redundancy between prosody and textLukas Wolf, Tiago Pimentel, Evelina Fedorenko, Ryan Cotterell, Alex Warstadt, Ethan Wilcox, Tamar Regev. 9765-9784 [doi]

CRoW: Benchmarking Commonsense Reasoning in Real-World TasksMete Ismayilzada, Debjit Paul, Syrielle Montariol, Mor Geva, Antoine Bosselut. 9785-9821 [doi]

A Video Is Worth 4096 Tokens: Verbalize Story Videos To Understand Them In Zero ShotAanisha Bhattacharyya, Yaman Singla, Balaji Krishnamurthy, Rajiv Ratn Shah, Changyou Chen. 9822-9839 [doi]

Label Words are Anchors: An Information Flow Perspective for Understanding In-Context LearningLean Wang, Lei Li, Damai Dai, Deli Chen, Hao Zhou, Fandong Meng, Jie Zhou, Xu Sun. 9840-9855 [doi]

Prompting Scientific Names for Zero-Shot Species RecognitionShubham Parashar, Zhiqiu Lin, Yanan Li, Shu Kong. 9856-9861 [doi]

Active Learning for Natural Language GenerationYotam Perlitz, Ariel Gera, Michal Shmueli-Scheuer, Dafna Sheinwald, Noam Slonim, Liat Ein-Dor. 9862-9877 [doi]

Re³Dial: Retrieve, Reorganize and Rescale Conversations for Long-Turn Open-Domain Dialogue Pre-trainingJiaxin Wen, Hao Zhou, Jian Guan, Jie Zhou, Minlie Huang. 9878-9894 [doi]

MultiTurnCleanup: A Benchmark for Multi-Turn Spoken Conversational Transcript CleanupHua Shen, Vicky Zayats, Johann C. Rocholl, Daniel D. Walker, Dirk Padfield. 9895-9903 [doi]

Do All Languages Cost the Same? Tokenization in the Era of Commercial Language ModelsOrevaoghene Ahia, Sachin Kumar 0009, Hila Gonen, Jungo Kasai, David R. Mortensen, Noah A. Smith, Yulia Tsvetkov. 9904-9923 [doi]

Characterizing Mechanisms for Factual Recall in Language ModelsQinan Yu, Jack Merullo, Ellie Pavlick. 9924-9959 [doi]

MULTITuDE: Large-Scale Multilingual Machine-Generated Text Detection BenchmarkDominik Macko, Róbert Móro, Adaku Uchendu, Jason Samuel Lucas, Michiharu Yamashita, Matús Pikuliak, Ivan Srba, Thai Le, Dongwon Lee 0001, Jakub Simko, Mária Bieliková. 9960-9987 [doi]

Revisiting Block-based Quantisation: What is Important for Sub-8-bit LLM Inference?Cheng Zhang, Jianyi Cheng, Ilia Shumailov, George A. Constantinides, Yiren Zhao. 9988-10006 [doi]

Whispering LLaMA: A Cross-Modal Generative Error Correction Framework for Speech RecognitionSrijith Radhakrishnan, Chao-Han Huck Yang, Sumeer Ahmad Khan, Rohit Kumar, Narsis A. Kiani, David Gomez-Cabrero, Jesper Tegnér. 10007-10016 [doi]

Reducing Sequence Length by Predicting Edit Spans with Large Language ModelsMasahiro Kaneko, Naoaki Okazaki. 10017-10029 [doi]

Instruct and Extract: Instruction Tuning for On-Demand Information ExtractionYizhu Jiao, Ming Zhong 0005, Sha Li, Ruining Zhao, Siru Ouyang, Heng Ji, Jiawei Han 0001. 10030-10051 [doi]

Rethinking the Evaluation for Conversational Recommendation in the Era of Large Language ModelsXiaolei Wang, Xinyu Tang, Xin Zhao, Jingyuan Wang, Ji-Rong Wen. 10052-10065 [doi]

ReCEval: Evaluating Reasoning Chains via Correctness and InformativenessArchiki Prasad, Swarnadeep Saha, Xiang Zhou, Mohit Bansal. 10066-10086 [doi]

Expand, Highlight, Generate: RL-driven Document Generation for Passage RerankingArian Askari, Mohammad Aliannejadi, Chuan Meng, Evangelos Kanoulas, Suzan Verberne. 10087-10099 [doi]

Transformer-based Live Update Generation for Soccer Matches from Microblog PostsMasashi Oshika, Kosuke Yamada, Ryohei Sasano, Koichi Takeda 0003. 10100-10106 [doi]

Make Every Example Count: On the Stability and Utility of Self-Influence for Learning from Noisy NLP DatasetsIrina Bejan, Artem Sokolov, Katja Filippova. 10107-10121 [doi]

Appraising the Potential Uses and Harms of LLMs for Medical Systematic ReviewsHye Yun, Iain James Marshall, Thomas A. Trikalinos, Byron C. Wallace. 10122-10139 [doi]

PromptST: Abstract Prompt Learning for End-to-End Speech TranslationTengfei Yu, Liang Ding 0006, Xuebo Liu 0002, Kehai Chen, Meishan Zhang, Dacheng Tao, Min Zhang. 10140-10154 [doi]

Text Rendering Strategies for Pixel Language ModelsJonas F. Lotz, Elizabeth Salesky, Phillip Rust, Desmond Elliott. 10155-10172 [doi]

APoLLo : Unified Adapter and Prompt Learning for Vision Language ModelsSanjoy Chowdhury, Sayan Nag, Dinesh Manocha. 10173-10187 [doi]

SAMRank: Unsupervised Keyphrase Extraction using Self-Attention Map in BERT and GPT-2Byungha Kang, Youhyun Shin. 10188-10201 [doi]

Contrastive Learning for Inference in DialogueEtsuko Ishii, Yan Xu, Bryan Wilie, Ziwei Ji, Holy Lovenia, Willy Chung, Pascale Fung. 10202-10221 [doi]

Editing Large Language Models: Problems, Methods, and OpportunitiesYunzhi Yao, Peng Wang, Bozhong Tian, Siyuan Cheng 0008, Zhoubo Li, Shumin Deng, Huajun Chen, Ningyu Zhang 0001. 10222-10240 [doi]

MarkQA: A large scale KBQA dataset with numerical reasoningXiang Huang, Sitao Cheng, Yuheng Bao, Shanshan Huang, Yuzhong Qu. 10241-10259 [doi]

Comparing Biases and the Impact of Multilingual Training across Multiple LanguagesSharon Levy, Neha John, Ling Liu, Yogarshi Vyas, Jie Ma, Yoshinari Fujinuma, Miguel Ballesteros, Vittorio Castelli, Dan Roth. 10260-10280 [doi]

HutCRS: Hierarchical User-Interest Tracking for Conversational Recommender SystemMingjie Qian, Yongsen Zheng, Jinghui Qin, Liang Lin. 10281-10290 [doi]

Large Language Models Meet Open-World Intent Discovery and Recognition: An Evaluation of ChatGPTXiaoshuai Song, Keqing He, Pei Wang, Guanting Dong, Yutao Mou, Jingang Wang, Yunsen Xian, Xunliang Cai, Weiran Xu. 10291-10304 [doi]

The Distributional Hypothesis Does Not Fully Explain the Benefits of Masked Language Model PretrainingTing-Rui Chiang, Dani Yogatama. 10305-10321 [doi]

Simple and Effective Input Reformulations for TranslationBrian Yu, Hansen Lillemark, Kurt Keutzer. 10322-10334 [doi]

Pointwise Mutual Information Based Metric and Decoding Strategy for Faithful Generation in Document Grounded DialogsYatin Nandwani, Vineet Kumar, Dinesh Raghu, Sachindra Joshi, Luis A. Lastras. 10335-10347 [doi]

The ACL OCL Corpus: Advancing Open Science in Computational LinguisticsShaurya Rohatgi, Yanxia Qin, Benjamin Aw, Niranjana Unnithan, Min-Yen Kan. 10348-10361 [doi]

Using Artificial French Data to Understand the Emergence of Gender Bias in Transformer Language ModelsLina Conti, Guillaume Wisniewski. 10362-10371 [doi]

Learning to Rank Context for Named Entity Recognition Using a Synthetic DatasetArthur Amalvy, Vincent Labatut, Richard Dufour. 10372-10382 [doi]

Improving Diversity of Demographic Representation in Large Language Models via Collective-Critiques and Self-VotingPreethi Lahoti, Nicholas Blumm, Xiao Ma 0010, Raghavendra Kotikalapudi, Sahitya Potluri, Qijun Tan, Hansa Srinivasan, Ben Packer, Ahmad Beirami, Alex Beutel, Jilin Chen. 10383-10405 [doi]

Hidding the Ghostwriters: An Adversarial Evaluation of AI-Generated Student Essay DetectionXinlin Peng, Ying Zhou, Ben He, Le Sun 0001, Yingfei Sun. 10406-10419 [doi]

Contextual Interaction for Argument Post Quality AssessmentYiran Wang, Xuanang Chen, Ben He, Le Sun. 10420-10432 [doi]

Pre-training Intent-Aware Encoders for Zero- and Few-Shot Intent ClassificationMujeen Sung, James Gung, Elman Mansimov, Nikolaos Pappas 0004, Raphael Shu, Salvatore Romeo, Yi Zhang, Vittorio Castelli. 10433-10442 [doi]

Synthetic Data Generation with Large Language Models for Text Classification: Potential and LimitationsZhuoyan Li, Hangxiao Zhu, Zhuoran Lu, Ming Yin 0001. 10443-10461 [doi]

GazeVQA: A Video Question Answering Dataset for Multiview Eye-Gaze Task-Oriented CollaborationsMuhammet Ilaslan, Chenan Song, Joya Chen, Difei Gao, Weixian Lei, Qianli Xu, Joo Lim, Mike Zheng Shou. 10462-10479 [doi]

People Make Better Edits: Measuring the Efficacy of LLM-Generated Counterfactually Augmented Data for Harmful Language DetectionIndira Sen, Dennis Assenmacher, Mattia Samory, Isabelle Augenstein, Wil van der Aalst, Claudia Wagner 0001. 10480-10504 [doi]

Unraveling Feature Extraction Mechanisms in Neural NetworksXiaobing Sun 0002, Jiaxi Li, Wei Lu 0011. 10505-10530 [doi]

CAPSTONE: Curriculum Sampling for Dense Retrieval with Document ExpansionXingwei He 0003, Yeyun Gong, A-Long Jin, Hang Zhang 0001, Anlei Dong, Jian Jiao 0007, Siu-Ming Yiu, Nan Duan. 10531-10541 [doi]

Balance Act: Mitigating Hubness in Cross-Modal Retrieval with Query and Gallery BanksYimu Wang, Xiangru Jian, Bo Xue 0004. 10542-10567 [doi]

E-CORE: Emotion Correlation Enhanced Empathetic Dialogue GenerationFengyi Fu, Lei Zhang, Quan Wang, Zhendong Mao. 10568-10586 [doi]

What do Deck Chairs and Sun Hats Have in Common? Uncovering Shared Properties in Large Concept VocabulariesAmit Gajbhiye, Zied Bouraoui, Na Li, Usashi Chatterjee, Luis Espinosa Anke, Steven Schockaert. 10587-10596 [doi]

ALDi: Quantifying the Arabic Level of Dialectness of TextAmr Keleg, Sharon Goldwater, Walid Magdy. 10597-10611 [doi]

3DRP-Net: 3D Relative Position-aware Network for 3D Visual GroundingZehan Wang, Haifeng Huang, Yang Zhao, Linjun Li, Xize Cheng, Yichen Zhu, Aoxiong Yin, Zhou Zhao. 10612-10625 [doi]

Goal-Driven Explainable Clustering via Language DescriptionsZihan Wang, Jingbo Shang, Ruiqi Zhong. 10626-10649 [doi]

Cross-Lingual Consistency of Factual Knowledge in Multilingual Language ModelsJirui Qi, Raquel Fernández, Arianna Bisazza. 10650-10666 [doi]

Learning from Mistakes via Cooperative Study Assistant for Large Language ModelsDanqing Wang, Lei Li. 10667-10685 [doi]

Bridging the Digital Divide: Performance Variation across Socio-Economic Factors in Vision-Language ModelsJoan Nwatu, Oana Ignat, Rada Mihalcea. 10686-10702 [doi]

Conceptor-Aided Debiasing of Large Language ModelsLi Yifei, Lyle H. Ungar, João Sedoc. 10703-10727 [doi]

AMR Parsing is Far from Solved: GrAPES, the Granular AMR Parsing Evaluation SuiteJonas Groschwitz, Shay Cohen, Lucia Donatelli, Meaghan Fowlie. 10728-10752 [doi]

Rethinking and Improving Multi-task Learning for End-to-end Speech TranslationYuhao Zhang, Chen Xu, Bei Li, Hao Chen, Tong Xiao, Chunliang Zhang, Jingbo Zhu. 10753-10765 [doi]

AD-NLP: A Benchmark for Anomaly Detection in Natural Language ProcessingMatei Bejan, Andrei Manolache, Marius Popescu. 10766-10778 [doi]

Enhancing the Ranking Context of Dense Retrieval through Reciprocal Nearest NeighborsGeorge Zerveas, Navid Rekabsaz, Carsten Eickhoff. 10779-10803 [doi]

Cross-Lingual Cross-Target Stance Detection with Dual Knowledge Distillation FrameworkRuike Zhang, Hanxuan Yang 0002, Wenji Mao. 10804-10819 [doi]

PRESTO: A Multilingual Dataset for Parsing Realistic Task-Oriented DialogsRahul Goel, Waleed Ammar, Aditya Gupta, Siddharth Vashishtha, Motoki Sano, Faiz Surani, Max Chang, HyunJeong Choe, David Greene, Chuan He, Rattima Nitisaroj, Anna Trukhina, Shachi Paul, Pararth Shah, Rushin Shah, Zhou Yu. 10820-10833 [doi]

An Iteratively Parallel Generation Method with the Pre-Filling Strategy for Document-level Event ExtractionGuanhua Huang, Runxin Xu, Ying Zeng, Jiaze Chen, Zhouwang Yang, Weinan E. 10834-10852 [doi]

CoMPosT: Characterizing and Evaluating Caricature in LLM SimulationsMyra Cheng, Tiziano Piccardi, Diyi Yang. 10853-10875 [doi]

Reduce Human Labor On Evaluating Conversational Information Retrieval System: A Human-Machine Collaboration ApproachChen Huang, Peixin Qin, Wenqiang Lei, Jiancheng Lv 0001. 10876-10891 [doi]

BERTie Bott's Every Flavor Labels: A Tasty Introduction to Semantic Role Labeling for GalicianMicaella Bruton, Meriem Beloucif. 10892-10902 [doi]

Program Translation via Code DistillationYufan Huang, MengNan Qi, Yongqiang Yao, Maoquan Wang, Bin Gu, Colin B. Clement, Neel Sundaresan. 10903-10914 [doi]

FaMeSumm: Investigating and Improving Faithfulness of Medical SummarizationNan Zhang, Yusen Zhang, Wu Guo, Prasenjit Mitra, Rui Zhang. 10915-10931 [doi]

Grammar-Constrained Decoding for Structured NLP Tasks without FinetuningSaibo Geng, Martin Josifoski, Maxime Peyrard, Robert West 0001. 10932-10952 [doi]

Systematic word meta-sense extensionLei Yu. 10953-10966 [doi]

Evaluating Evaluation Metrics: A Framework for Analyzing NLG Evaluation Metrics using Measurement TheoryZiang Xiao, Susu Zhang, Vivian Lai, Q. Vera Liao. 10967-10982 [doi]

Revisiting the Knowledge Injection FrameworksPeng Fu, Yiming Zhang, Haobo Wang, Weikang Qiu, Junbo Zhao. 10983-10997 [doi]

We Are What We Repeatedly Do: Inducing and Deploying Habitual Schemas in Persona-Based ResponsesBenjamin Kane, Lenhart K. Schubert. 10998-11016 [doi]

Zero-shot Faithfulness Evaluation for Text Summarization with Foundation Language ModelQi Jia 0003, Siyu Ren, Yizhu Liu, Kenny Q. Zhu. 11017-11031 [doi]

TaskWeb: Selecting Better Source Tasks for Multi-task NLPJoongwon Kim, Akari Asai, Gabriel Ilharco, Hannaneh Hajishirzi. 11032-11052 [doi]

Improving Bias Mitigation through Bias Experts in Natural Language UnderstandingEojin Jeon, Mingyu Lee, Juhyeong Park, Yeachan Kim, Wing-Lam Mok, SangKeun Lee 0001. 11053-11066 [doi]

Semi-supervised multimodal coreference resolution in image narrationsArushi Goel, Basura Fernando, Frank Keller, Hakan Bilen. 11067-11081 [doi]

A Predictive Factor Analysis of Social Biases and Task-Performance in Pretrained Masked Language ModelsYi Zhou, José Camacho-Collados, Danushka Bollegala. 11082-11100 [doi]

Argument-based Detection and Classification of Fallacies in Political DebatesPierpaolo Goffredo, Mariana Espinoza, Serena Villata, Elena Cabrio. 11101-11112 [doi]

Collaborative Generative AI: Integrating GPT-k for Efficient Editing in Text-to-Image GenerationWanrong Zhu, Xinyi Wang, Yujie Lu, Tsu-Jui Fu, Xin Wang, Miguel P. Eckstein, William Wang. 11113-11122 [doi]

SpEL: Structured Prediction for Entity LinkingHassan Shavarani, Anoop Sarkar. 11123-11137 [doi]

Architectural Sweet Spots for Modeling Human Label Variation by the Example of Argument Quality: It's Best to Relate Perspectives!Philipp Heinisch, Matthias Orlikowski, Julia Romberg, Philipp Cimiano. 11138-11154 [doi]

Explicit Planning Helps Language Models in Logical ReasoningHongyu Zhao 0006, Kangrui Wang, Mo Yu, Hongyuan Mei. 11155-11173 [doi]

clembench: Using Game Play to Evaluate Chat-Optimized Language Models as Conversational AgentsKranti Chalamalasetti, Jana Götze, Sherzod Hakimov, Brielen Madureira, Philipp Sadler, David Schlangen. 11174-11219 [doi]

Explaining with Contrastive Phrasal Highlighting: A Case Study in Assisting Humans to Detect Translation DifferencesEleftheria Briakou, Navita Goyal, Marine Carpuat. 11220-11237 [doi]

Polyglot or Not? Measuring Multilingual Encyclopedic Knowledge in Foundation ModelsTim Schott, Daniel Furman, Shreshta Bhat. 11238-11253 [doi]

Anchoring Fine-tuning of Sentence Transformer with Semantic Label Information for Efficient Truly Few-shot ClassificationAmalie Brogaard Pauli, Leon Derczynski, Ira Assent. 11254-11264 [doi]

UDAPDR: Unsupervised Domain Adaptation via LLM Prompting and Distillation of RerankersJon Saad-Falcon, Omar Khattab, Keshav Santhanam, Radu Florian, Martin Franz, Salim Roukos, Avirup Sil, Md. Arafat Sultan, Christopher Potts. 11265-11279 [doi]

TATA: Stance Detection via Topic-Agnostic and Topic-Aware EmbeddingsHans W. A. Hanley, Zakir Durumeric. 11280-11294 [doi]

Data Similarity is Not Enough to Explain Language Model PerformanceGregory Yauney, Emily Reif, David Mimno. 11295-11304 [doi]

Zero-shot Sharpness-Aware Quantization for Pre-trained Language ModelsMiaoxi Zhu, Qihuang Zhong, Li Shen 0008, Liang Ding 0006, Juhua Liu, Bo Du 0001, Dacheng Tao. 11305-11327 [doi]

Deciphering Stereotypes in Pre-Trained Language ModelsWeicheng Ma, Henry Scheible, Brian Wang, Goutham Veeramachaneni, Pratim Chowdhary, Alan Sun, Andrew Koulogeorge, Lili Wang, Diyi Yang, Soroush Vosoughi. 11328-11345 [doi]

An "Integrative Survey on Mental Health Conversational Agents to Bridge Computer Science and Medical Perspectives"Young-Min Cho, Sunny Rai, Lyle H. Ungar, João Sedoc, Sharath Chandra Guntuku. 11346-11369 [doi]

Do LLMs Understand Social Knowledge? Evaluating the Sociability of Large Language Models with SocKET BenchmarkMinje Choi, Jiaxin Pei, Sagar Kumar, Chang Shu, David Jurgens. 11370-11403 [doi]

Interventional RationalizationLinan Yue, Qi Liu, Li Wang, Yanqing An, Yichao Du, Zhenya Huang. 11404-11418 [doi]

Don't Take This Out of Context!: On the Need for Contextual Models and Evaluations for Stylistic RewritingAkhila Yerukola, Xuhui Zhou, Elizabeth Clark, Maarten Sap. 11419-11444 [doi]

Axiomatic Preference Modeling for Longform Question AnsweringCorby Rosset, Guoqing Zheng, Victor Dibia, Ahmed Awadallah 0001, Paul N. Bennett. 11445-11475 [doi]

Countering Misinformation via Emotional Response GenerationDaniel Russo 0004, Shane P. Kaszefski-Yaschuk, Jacopo Staiano, Marco Guerini. 11476-11492 [doi]

Seq2seq is All You Need for Coreference ResolutionWenzheng Zhang, Sam Wiseman, Karl Stratos. 11493-11504 [doi]

Integrating Language Models into Direct Speech Translation: An Inference-Time Solution to Control Gender InflectionDennis Fucci, Marco Gaido, Sara Papi, Mauro Cettolo, Matteo Negri, Luisa Bentivogli. 11505-11517 [doi]

StoryAnalogy: Deriving Story-level Analogies from Large Language Models to Unlock Analogical UnderstandingJiayang Cheng, Lin Qiu, Tsz Ho Chan, Tianqing Fang, Weiqi Wang, Chunkit Chan, Dongyu Ru, Qipeng Guo, Hongming Zhang, Yangqiu Song, Yue Zhang, Zheng Zhang. 11518-11537 [doi]

Beyond Detection: A Defend-and-Summarize Strategy for Robust and Interpretable Rumor Analysis on Social MediaYi-Ting Chang, Yun-Zhu Song, Yi-Syuan Chen, Hong-Han Shuai. 11538-11556 [doi]

Crystal: Introspective Reasoners Reinforced with Self-FeedbackJiacheng Liu 0010, Ramakanth Pasunuru, Hannaneh Hajishirzi, Yejin Choi 0001, Asli Celikyilmaz. 11557-11572 [doi]

DiffS2UT: A Semantic Preserving Diffusion Model for Textless Direct Speech-to-Speech TranslationYongxin Zhu, Zhujin Gao, Xinyuan Zhou, Zhongyi Ye, Linli Xu. 11573-11583 [doi]

BioFEG: Generate Latent Features for Biomedical Entity LinkingXuhui Sui, Ying Zhang, Xiangrui Cai, Kehui Song, Baohang Zhou, Xiaojie Yuan, Wensheng Zhang. 11584-11593 [doi]

TRIGO: Benchmarking Formal Mathematical Proof Reduction for Generative Language ModelsJing Xiong, Jianhao Shen, Ye Yuan, Haiming Wang, Yichun Yin, Zhengying Liu, Lin Li, Zhijiang Guo, Qingxing Cao, Yinya Huang, Chuanyang Zheng, Xiaodan Liang, Ming Zhang 0004, Qun Liu 0001. 11594-11632 [doi]

Physician Detection of Clinical Harm in Machine Translation: Quality Estimation Aids in Reliance and Backtranslation Identifies Critical ErrorsNikita Mehandru, Sweta Agrawal, Yimin Xiao, Ge Gao, Elaine C. Khoong, Marine Carpuat, Niloufar Salehi. 11633-11647 [doi]

Vicarious Offense and Noise Audit of Offensive Speech Classifiers: Unifying Human and Machine Disagreement on What is OffensiveTharindu Cyril Weerasooriya, Sujan Dutta, Tharindu Ranasinghe, Marcos Zampieri, Christopher Homan, Ashiqur R. KhudaBukhsh. 11648-11668 [doi]

Generating Summaries with Controllable Readability LevelsLeonardo F. R. Ribeiro, Mohit Bansal, Markus Dreyer. 11669-11687 [doi]

mAggretriever: A Simple yet Effective Approach to Zero-Shot Multilingual Dense RetrievalSheng-Chieh Lin, Amin Ahmad, Jimmy Lin. 11688-11696 [doi]

CodeFusion: A Pre-trained Diffusion Model for Code GenerationMukul Singh, José Cambronero, Sumit Gulwani, Vu Le 0002, Carina Negreanu, Gust Verbruggen. 11697-11708 [doi]

CESAR: Automatic Induction of Compositional Instructions for Multi-turn DialogsTaha Aksu, Devamanyu Hazarika, Shikib Mehri, Seokhwan Kim, Dilek Hakkani-Tur, Yang Liu, Mahdi Namazifar. 11709-11737 [doi]

VECHR: A Dataset for Explainable and Robust Classification of Vulnerability Type in the European Court of Human RightsShanshan Xu, Leon Staufer, T. Y. S. S. Santosh, Oana Ichim, Corina Heri, Matthias Grabmair. 11738-11752 [doi]

ACQUIRED: A Dataset for Answering Counterfactual Questions In Real-Life VideosTe-Lin Wu, Zi-Yi Dou, Qingyuan Hu, Yu Hou, Nischal Reddy Chandra, Marjorie Freedman, Ralph M. Weischedel, Nanyun Peng. 11753-11770 [doi]

From Parse-Execute to Parse-Execute-Refine: Improving Semantic Parser for Complex Question Answering over Knowledge BaseWangzhen Guo, Linyin Luo, Hanjiang Lai, Jian Yin 0001. 11771-11780 [doi]

Reward-Augmented Decoding: Efficient Controlled Text Generation With a Unidirectional Reward ModelHaikang Deng, Colin Raffel. 11781-11791 [doi]

CORE: A Few-Shot Company Relation Classification Dataset for Robust Domain AdaptationPhilipp Borchert, Jochen De Weerdt, Kristof Coussement, Arno De Caigny, Marie-Francine Moens. 11792-11806 [doi]

Models See Hallucinations: Evaluating the Factuality in Video CaptioningHui Liu, Xiaojun Wan 0001. 11807-11823 [doi]

Back Transcription as a Method for Evaluating Robustness of Natural Language Understanding Models to Speech Recognition ErrorsMarek Kubis, Pawel Skórzewski, Marcin Sowanski, Tomasz Zietkiewicz. 11824-11835 [doi]

Cabbage Sweeter than Cake? Analysing the Potential of Large Language Models for Learning Conceptual SpacesUsashi Chatterjee, Amit Gajbhiye, Steven Schockaert. 11836-11842 [doi]

Can Language Models Understand Physical Concepts?Lei Li, Jingjing Xu, Qingxiu Dong, Ce Zheng, Xu Sun, Lingpeng Kong, Qi Liu. 11843-11861 [doi]

SPT: Learning to Selectively Insert Prompts for Better Prompt TuningWei Zhu, Ming Tan. 11862-11878 [doi]

Once Upon a Time in Graph: Relative-Time Pretraining for Complex Temporal ReasoningSen Yang, Xin Li, Lidong Bing, Wai Lam. 11879-11895 [doi]

Expository Text Generation: Imitate, Retrieve, ParaphraseNishant Balepur, Jie Huang 0009, Kevin Chen-Chuan Chang. 11896-11919 [doi]

Large-scale similarity search with Optimal TransportCléa Laouar, Yuki Takezawa, Makoto Yamada. 11920-11930 [doi]

Enhancing Textbooks with Visuals from the Web for Improved LearningJanvijay Singh, Vilém Zouhar, Mrinmaya Sachan. 11931-11944 [doi]

Continual Event Extraction with Semantic Confusion RectificationZitao Wang, Xinyi Wang, Wei Hu 0007. 11945-11955 [doi]

An Empirical Study of Translation Hypothesis Ensembling with Large Language ModelsAntónio Farinhas, José Guilherme Camargo de Souza, André F. T. Martins. 11956-11970 [doi]

FedTherapist: Mental Health Monitoring with User-Generated Linguistic Expressions on Smartphones via Federated LearningJaemin Shin, Hyungjun Yoon, Seungjoo Lee, Sungjoon Park, Yunxin Liu, Jinho D. Choi, Sung-Ju Lee. 11971-11988 [doi]

Visually-Situated Natural Language Understanding with Contrastive Reading Model and Frozen Large Language ModelsGeewook Kim, Hodong Lee, Daehee Kim, Haeji Jung, Sanghee Park, Yoonsik Kim, Sangdoo Yun, Taeho Kil, Bado Lee, Seunghyun Park. 11989-12010 [doi]

Continual Learning for Multilingual Neural Machine Translation via Dual Importance-based Model DivisionJunpeng Liu, Kaiyu Huang, Hao Yu, Jiuyi Li, Jinsong Su, Degen Huang. 12011-12027 [doi]

SimCSE++: Improving Contrastive Learning for Sentence Embeddings from Two PerspectivesJiahao Xu, Wei Shao, Lihui Chen, Lemao Liu 0001. 12028-12040 [doi]

Unlearn What You Want to Forget: Efficient Unlearning for LLMsJiaao Chen, Diyi Yang. 12041-12052 [doi]

Simplicity Level Estimate (SLE): A Learned Reference-Less Metric for Sentence SimplificationLiam Cripwell, Joël Legrand, Claire Gardent. 12053-12059 [doi]

Precedent-Enhanced Legal Judgment Prediction with LLM and Domain-Model CollaborationYiquan Wu, Siying Zhou, YiFei Liu, Weiming Lu 0001, Xiaozhong Liu, Yating Zhang, Changlong Sun, Fei Wu 0001, Kun Kuang. 12060-12075 [doi]

FActScore: Fine-grained Atomic Evaluation of Factual Precision in Long Form Text GenerationSewon Min, Kalpesh Krishna, Xinxi Lyu, Mike Lewis, Wen-tau Yih, Pang Wei Koh, Mohit Iyyer, Luke Zettlemoyer, Hannaneh Hajishirzi. 12076-12100 [doi]

Calc-X and Calcformers: Empowering Arithmetical Chain-of-Thought through Interaction with Symbolic SystemsMarek Kadlcík, Michal Stefánik, Ondrej Sotolár, Vlastimil Martinek. 12101-12108 [doi]

CoF-CoT: Enhancing Large Language Models with Coarse-to-Fine Chain-of-Thought Prompting for Multi-domain NLU TasksHoang Nguyen, Ye Liu, Chenwei Zhang, Tao Zhang, Philip S. Yu. 12109-12119 [doi]

When Language Models Fall in Love: Animacy Processing in Transformer Language ModelsMichael Hanna 0001, Yonatan Belinkov, Sandro Pezzelle. 12120-12135 [doi]

Improving Unsupervised Relation Extraction by Augmenting Diverse Sentence PairsQing Wang, Kang Zhou, Qiao Qiao, Yuepei Li, Qi Li. 12136-12147 [doi]

Paraphrase Types for Generation and DetectionJan Philip Wahle, Bela Gipp, Terry Ruas. 12148-12164 [doi]

Target-to-Source Augmentation for Aspect Sentiment Triplet ExtractionYice Zhang, Yifan Yang, Meng Li, Bin Liang, Shiwei Chen, Ruifeng Xu. 12165-12177 [doi]

PAC-tuning: Fine-tuning Pre-trained Language Models with PAC-driven Perturbed Gradient DescentGuangliang Liu, Zhiyu Xue, Xitong Zhang, Kristen Marie Johnson, Rongrong Wang. 12178-12189 [doi]

Emergence of Abstract State Representations in Embodied Sequence ModelingTian Yun, Zilai Zeng, Kunal Handa, Ashish V. Thapliyal, Bo Pang, Ellie Pavlick, Chen Sun. 12190-12205 [doi]

Accelerating Toeplitz Neural Network with Constant-time Inference ComplexityZhen Qin, Yiran Zhong. 12206-12215 [doi]

Dissecting Recall of Factual Associations in Auto-Regressive Language ModelsMor Geva, Jasmijn Bastings, Katja Filippova, Amir Globerson. 12216-12235 [doi]

StereoMap: Quantifying the Awareness of Human-like Stereotypes in Large Language ModelsSullam Jeoung, Yubin Ge, Jana Diesner. 12236-12256 [doi]

Select, Prompt, Filter: Distilling Large Language Models for Summarizing ConversationsMinh Quang Pham, Sathish Indurthi, Shamil Chollampatt, Marco Turchi. 12257-12265 [doi]

Human Raters Cannot Distinguish English Translations from Original English TextsShira Wein. 12266-12272 [doi]

Impressions: Visual Semiotics and Aesthetic Impact UnderstandingJulia Kruk, Caleb Ziems, Diyi Yang. 12273-12291 [doi]

DNA: Denoised Neighborhood Aggregation for Fine-grained Category DiscoveryWenbin An, Feng Tian, Wenkai Shi, Yan Chen 0031, Qinghua Zheng, QianYing Wang, Ping Chen 0001. 12292-12302 [doi]

Prompt as Triggers for Backdoor Attack: Examining the Vulnerability in Language ModelsShuai Zhao, Jinming Wen, Anh Tuan Luu, Junbo Zhao, Jie Fu. 12303-12317 [doi]

UPRISE: Universal Prompt Retrieval for Improving Zero-Shot EvaluationDaixuan Cheng, Shaohan Huang, Junyu Bi, Yuefeng Zhan, Jianfeng Liu, Yujing Wang, Hao Sun 0015, Furu Wei, Weiwei Deng, Qi Zhang. 12318-12337 [doi]

KRLS: Improving End-to-End Response Generation in Task Oriented Dialog with Reinforced Keywords LearningXiao Yu, Qingyang Wu, Kun Qian, Zhou Yu. 12338-12358 [doi]

Large Language Models Only Pass Primary School Exams in Indonesia: A Comprehensive Test on IndoMMLUFajri Koto, Nurul Aisyah, Haonan Li 0002, Timothy Baldwin. 12359-12374 [doi]

Let's Sample Step by Step: Adaptive-Consistency for Efficient Reasoning and Coding with LLMsAman Madaan Pranjal Aggarwal, Mausam Yiming Yang. 12375-12396 [doi]

Bridging Information-Theoretic and Geometric Compression in Language ModelsEmily Cheng, Corentin Kervadec, Marco Baroni. 12397-12420 [doi]

Pre-training Language Models for Comparative ReasoningMengxia Yu, Zhihan Zhang, Wenhao Yu 0002, Meng Jiang 0001. 12421-12433 [doi]

Improved Pseudo Data for Machine Translation Quality Estimation with Constrained Beam SearchXiang Geng, Yu Zhang, Zhejian Lai, Shuaijie She, Wei Zou, Shimin Tao, Hao Yang, Jiajun Chen, Shujian Huang. 12434-12447 [doi]

Text Embeddings Reveal (Almost) As Much As TextJohn X. Morris, Volodymyr Kuleshov, Vitaly Shmatikov, Alexander M. Rush. 12448-12460 [doi]

AutoTrial: Prompting Language Models for Clinical Trial DesignZifeng Wang 0010, Cao Xiao, Jimeng Sun 0001. 12461-12472 [doi]

Faster Minimum Bayes Risk Decoding with Confidence-based PruningJulius Cheng, Andreas Vlachos 0001. 12473-12480 [doi]

Enhancing Generative Retrieval with Reinforcement Learning from Relevance FeedbackYujia Zhou 0002, Zhicheng Dou, Ji-Rong Wen. 12481-12490 [doi]

Multi-Source Probing for Open-Domain Conversational UnderstandingYuanxi Li, Hao Zhou, Jie Zhou, Minlie Huang. 12491-12505 [doi]

Hallucination Mitigation in Natural Language Generation from Large-Scale Open-Domain Knowledge GraphsXiao Shi, Zhengyuan Zhu, Zeyu Zhang, Chengkai Li 0001. 12506-12521 [doi]

Multi-Source Multi-Type Knowledge Exploration and Exploitation for Dialogue GenerationXuanfan Ni, Hongliang Dai, Zhaochun Ren, Piji Li. 12522-12537 [doi]

Focus Your Attention (with Adaptive IIR Filters)Shahar Lutati, Itamar Zimerman, Lior Wolf. 12538-12549 [doi]

Identifying Statements Crucial for Awareness of Interpretive Nonsense to Prevent Communication BreakdownsTomoyuki Maekawa, Michita Imai. 12550-12566 [doi]

Multilingual Large Language Models Are Not (Yet) Code-SwitchersRuochen Zhang, Samuel Cahyawijaya, Jan Christian Blaise Cruz, Genta Winata, Alham Fikri Aji. 12567-12582 [doi]

Reinforced Target-driven Conversational PromotionHuy Dao, Lizi Liao, Dung D. Le, Yuxiang Nie. 12583-12596 [doi]

Identification of Multimodal Stance Towards Frames of CommunicationMaxwell A. Weinzierl, Sanda M. Harabagiu. 12597-12609 [doi]

Unsupervised Sounding Pixel LearningYining Zhang, Yanli Ji, Yang Yang 0002. 12610-12620 [doi]

LM vs LM: Detecting Factual Errors via Cross ExaminationRoi Cohen, May Hamri, Mor Geva, Amir Globerson. 12621-12640 [doi]

Large Language Models: The Need for Nuance in Current Debates and a Pragmatic Perspective on UnderstandingBram van Dijk, Tom Kouwenhoven, Marco Spruit, Max Johannes van Duijn. 12641-12654 [doi]

PIEClass: Weakly-Supervised Text Classification with Prompting and Noise-Robust Iterative Ensemble TrainingYunyi Zhang, Minhao Jiang, Yu Meng 0001, Yu Zhang, Jiawei Han 0001. 12655-12670 [doi]

MeaeQ: Mount Model Extraction Attacks with Efficient QueriesChengwei Dai, Minxuan Lv, Kun Li, Wei Zhou. 12671-12684 [doi]

The CoT Collection: Improving Zero-shot and Few-shot Learning of Language Models via Chain-of-Thought Fine-TuningSeungone Kim, Se June Joo, Doyoung Kim, Joel Jang, Seonghyeon Ye, Jamin Shin, Minjoon Seo. 12685-12708 [doi]

Explaining Interactions Between Text SpansSagnik Ray Choudhury, Pepa Atanasova, Isabelle Augenstein. 12709-12730 [doi]

Predictive Chemistry Augmented with Text RetrievalYujie Qian, Zhening Li, Zhengkai Tu, Connor W. Coley, Regina Barzilay. 12731-12745 [doi]

System Combination via Quality Estimation for Grammatical Error CorrectionMuhammad Reza Qorib, Hwee Tou Ng. 12746-12759 [doi]

Rethinking Negative Pairs in Code SearchHaochen Li, Xin Zhou, Anh Tuan Luu, Chunyan Miao. 12760-12774 [doi]

Question Answering as Programming for Solving Time-Sensitive QuestionsXinyu Zhu, Cheng Yang, Bei Chen, Siheng Li, Jian-Guang Lou, Yujiu Yang. 12775-12790 [doi]

Joint Geometrical and Statistical Domain Adaptation for Cross-domain Code Vulnerability DetectionQianjin Du, Shiji Zhou, Xiaohui Kuang, Gang Zhao, Jidong Zhai. 12791-12800 [doi]

Revisiting Sparse Retrieval for Few-shot Entity LinkingYulin Chen, Zhenran Xu, Baotian Hu, Min Zhang. 12801-12806 [doi]

Controlling Pre-trained Language Models for Grade-Specific Text SimplificationSweta Agrawal, Marine Carpuat. 12807-12819 [doi]

CLEVR-Implicit: A Diagnostic Dataset for Implicit Reasoning in Referring Expression ComprehensionJingwei Zhang, Xin Wu, Yi Cai 0001. 12820-12830 [doi]

"Are Your Explanations Reliable?" Investigating the Stability of LIME in Explaining Text Classifiers by Marrying XAI and Adversarial AttackChristopher Burger, Lingwei Chen, Thai Le. 12831-12844 [doi]

CQE: A Comprehensive Quantity ExtractorSatya Almasian, Vivian Kazakova, Philip Göldner, Michael Gertz 0001. 12845-12859 [doi]

Context Compression for Auto-regressive Transformers with Sentinel TokensSiyu Ren, Qi Jia 0003, Kenny Q. Zhu. 12860-12867 [doi]

A Unified View of Evaluation Metrics for Structured PredictionYunmo Chen, William Gantt, Tongfei Chen, Aaron Steven White, Benjamin Van Durme. 12868-12882 [doi]

A Deeper (Autoregressive) Approach to Non-Convergent Discourse ParsingOren Tsur, Yoav Tulpan. 12883-12895 [doi]

We are Who We Cite: Bridges of Influence Between Natural Language Processing and Other Academic FieldsJan Philip Wahle, Terry Ruas, Mohamed Abdalla, Bela Gipp, Saif M. Mohammad. 12896-12913 [doi]

Ties Matter: Meta-Evaluating Modern Metrics with Pairwise Accuracy and Tie CalibrationDaniel Deutsch, George F. Foster, Markus Freitag. 12914-12929 [doi]

SODA: Million-scale Dialogue Distillation with Social Commonsense ContextualizationHyunwoo Kim 0002, Jack Hessel, Liwei Jiang, Peter West, Ximing Lu, Youngjae Yu, Pei Zhou, Ronan Le Bras 0002, Malihe Alikhani, Gunhee Kim, Maarten Sap, Yejin Choi 0001. 12930-12949 [doi]

Multi-view Contrastive Learning for Entity Typing over Knowledge GraphsZhiwei Hu, Victor Gutiérrez-Basulto, Zhiliang Xiang, Ru Li 0001, Jeff Z. Pan. 12950-12963 [doi]

MailEx: Email Event and Argument ExtractionSaurabh Srivastava, Gaurav Singh, Shou Matsumoto, Ali Raz, Paulo C. G. Costa, Joshua Poore, Ziyu Yao. 12964-12987 [doi]

Optimized Tokenization for Transcribed Error CorrectionTomer Wullach, Shlomo E. Chazan. 12988-12997 [doi]

Beware of Model Collapse! Fast and Stable Test-time Adaptation for Robust Question AnsweringYi Su, Yixin Ji, Juntao Li, Hai Ye, Min Zhang. 12998-13011 [doi]

Generative Adversarial Training with Perturbed Token Detection for Model RobustnessJiahao Zhao, Wenji Mao. 13012-13025 [doi]

Multi-Task Knowledge Distillation with Embedding Constraints for Scholarly Keyphrase Boundary ClassificationSeo Park, Cornelia Caragea. 13026-13042 [doi]

Set Learning for Generative Information ExtractionJiangnan Li, Yice Zhang, Bin Liang, Kam-Fai Wong, Ruifeng Xu. 13043-13052 [doi]

Large Language Models and Multimodal Retrieval for Visual Word Sense DisambiguationAnastasia Kritharoula, Maria Lymperaiou, Giorgos Stamou. 13053-13077 [doi]

Be Selfish, But Wisely: Investigating the Impact of Agent Personality in Mixed-Motive Human-Agent InteractionsKushal Chawla, Ian Wu, Yu Rong, Gale M. Lucas, Jonathan Gratch. 13078-13092 [doi]

Doolittle: Benchmarks and Corpora for Academic Writing FormalizationShizhe Diao, Yongyu Lei, Liangming Pan, Tianqing Fang, Wangchunshu Zhou, Sedrick Scott Keh, Min-Yen Kan, Tong Zhang. 13093-13111 [doi]

Token Prediction as Implicit Classification to Identify LLM-Generated TextYutian Chen, Hao Kang, Vivian Zhai, Liangze Li, Rita Singh, Bhiksha Raj. 13112-13120 [doi]

On Evaluation of Bangla Word AnalogiesMousumi Akter, Souvika Sarkar, Shubhra Kanti Karmaker Santu. 13121-13127 [doi]

Reconstruct Before Summarize: An Efficient Two-Step Framework for Condensing and Summarizing Meeting TranscriptsHaochen Tan, Han Wu, Wei Shao, Xinyun Zhang, Mingjie Zhan, Zhaohui Hou, Ding Liang, Linqi Song. 13128-13141 [doi]

XLM-V: Overcoming the Vocabulary Bottleneck in Multilingual Masked Language ModelsDavis Liang, Hila Gonen, Yuning Mao, Rui Hou, Naman Goyal, Marjan Ghazvininejad, Luke Zettlemoyer, Madian Khabsa. 13142-13152 [doi]

Character-LLM: A Trainable Agent for Role-PlayingYunfan Shao, Linyang Li, Junqi Dai, Xipeng Qiu. 13153-13187 [doi]

Natural Language Decompositions of Implicit Content Enable Better Text RepresentationsAlexander Hoyle, Rupak Sarkar, Pranav Goel, Philip Resnik. 13188-13214 [doi]

A Scalable Framework for Table of Contents Extraction from Complex ESG Annual ReportsXinyu Wang, Lin Gui 0003, Yulan He 0001. 13215-13229 [doi]

Semantic Space Grounded Weighted Decoding for Multi-Attribute Controllable Dialogue GenerationZhiling Zhang, Mengyue Wu, Kenny Zhu. 13230-13243 [doi]

How do languages influence each other? Studying cross-lingual data sharing during LM fine-tuningRochelle Choenni, Dan Garrette, Ekaterina Shutova. 13244-13257 [doi]

COFFEE: Counterfactual Fairness for Personalized Text Generation in Explainable RecommendationNan Wang, Qifan Wang, Yi-Chia Wang, Maziar Sanjabi, Jingzhou Liu, Hamed Firooz, Hongning Wang, Shaoliang Nie. 13258-13275 [doi]

NameGuess: Column Name Expansion for Tabular DataJiani Zhang 0003, Zhengyuan Shen, Balasubramaniam Srinivasan, Shen Wang, Huzefa Rangwala, George Karypis. 13276-13290 [doi]

BLESS: Benchmarking Large Language Models on Sentence SimplificationTannon Kew, Alison Chi, Laura Vásquez-Rodríguez, Sweta Agrawal, Dennis Aumiller, Fernando Alva-Manchego, Matthew Shardlow. 13291-13309 [doi]

To Build Our Future, We Must Know Our Past: Contextualizing Paradigm Shifts in Natural Language ProcessingSireesh Gururaja, Amanda Bertsch, Clara Na, David Gray Widder, Emma Strubell. 13310-13325 [doi]

PALS: Personalized Active Learning for Subjective Tasks in NLPKamil Kanclerz, Konrad Karanowski, Julita Bielaniewicz, Marcin Gruza, Piotr Milkowski, Jan Kocon, Przemyslaw Kazienko. 13326-13341 [doi]

ViStruct: Visual Structural Knowledge Extraction via Curriculum Guided Code-Vision RepresentationYangyi Chen, Xingyao Wang 0002, Manling Li, Derek Hoiem, Heng Ji. 13342-13357 [doi]

LLMLingua: Compressing Prompts for Accelerated Inference of Large Language ModelsHuiqiang Jiang, Qianhui Wu, Chin-Yew Lin, YuQing Yang, Lili Qiu. 13358-13376 [doi]

EXPLAIN, EDIT, GENERATE: Rationale-Sensitive Counterfactual Data Augmentation for Multi-hop Fact VerificationYingJie Zhu, Jiasheng Si, YiBo Zhao, Haiyang Zhu, Deyu Zhou, Yulan He 0001. 13377-13392 [doi]

An Exploration of Left-Corner TransformationsAndreas Opedal, Eleftheria Tsipidi, Tiago Pimentel, Ryan Cotterell, Tim Vieira. 13393-13427 [doi]

Characterizing and Verifying Scientific Claims: Qualitative Causal Structure is All You NeedJinxuan Wu, WenHan Chao, Xian Zhou 0003, Zhunchen Luo. 13428-13439 [doi]

FOCUS: Effective Embedding Initialization for Monolingual Specialization of Multilingual ModelsKonstantin Dobler, Gerard de Melo. 13440-13454 [doi]

ByteSized32: A Corpus and Challenge Task for Generating Task-Specific World Models Expressed as Text GamesRuoyao Wang, Graham Todd, Xingdi Yuan, Ziang Xiao, Marc-Alexandre Côté, Peter A. Jansen. 13455-13471 [doi]

Skill-Based Few-Shot Selection for In-Context LearningShengnan An, Bo Zhou, Zeqi Lin, Qiang Fu, Bei Chen, Nanning Zheng 0001, Weizhu Chen, Jian-Guang Lou. 13472-13492 [doi]

MaNtLE: Model-agnostic Natural Language ExplainerRakesh Menon, Kerem Zaman, Shashank Srivastava. 13493-13511 [doi]

PTP: Boosting Stability and Performance of Prompt Tuning with Perturbation-Based RegularizerLichang Chen, Jiuhai Chen, Heng Huang, Minhao Cheng. 13512-13525 [doi]

Ling-CL: Understanding NLP Models through Linguistic CurriculaMohamed Elgaar, Hadi Amiri. 13526-13542 [doi]

Towards Unsupervised Recognition of Token-level Semantic Differences in Related DocumentsJannis Vamvas, Rico Sennrich. 13543-13552 [doi]

Towards a Better Understanding of Variations in Zero-Shot Neural Machine Translation PerformanceShaomu Tan, Christof Monz. 13553-13568 [doi]

SEER : A Knapsack approach to Exemplar Selection for In-Context HybridQAJonathan Tonglet, Manon Reusens, Philipp Borchert, Bart Baesens. 13569-13583 [doi]

Conversation Chronicles: Towards Diverse Temporal and Relational Dynamics in Multi-Session ConversationsJihyoung Jang, Minseong Boo, Hyounghun Kim. 13584-13606 [doi]

DueT: Image-Text Contrastive Transfer Learning with Dual-adapter TuningTaku Hasegawa, Kyosuke Nishida, Koki Maeda, Kuniko Saito. 13607-13624 [doi]

Towards a Unified Conversational Recommendation System: Multi-task Learning via Contextualized Knowledge DistillationYeongseo Jung, Eunseo Jung, Lei Chen. 13625-13637 [doi]

CLAIR: Evaluating Image Captions with Large Language ModelsDavid Chan, Suzanne Petryk, Joseph Gonzalez 0001, Trevor Darrell, John F. Canny. 13638-13646 [doi]

MoPe: Model Perturbation based Privacy Attacks on Language ModelsMarvin Li, Jason Wang, Jeffrey Wang, Seth Neel. 13647-13660 [doi]

q2d: Turning Questions into Dialogs to Teach Models How to SearchYonatan Bitton, Shlomi Cohen-Ganor, Ido Hakimi, Yoad Lewenberg, Roee Aharoni, Enav Weinreb. 13661-13676 [doi]

Aligning Large Language Models through Synthetic FeedbackSungdong Kim, Sanghwan Bae, Jamin Shin, Soyoung Kang, Donghyun Kwak, Kang Min Yoo, Minjoon Seo. 13677-13700 [doi]

You Told Me That Joke Twice: A Systematic Investigation of Transferability and Robustness of Humor Detection ModelsAlexander Baranov, Vladimir Kniazhevsky, Pavel Braslavski. 13701-13715 [doi]

Reading Order Matters: Information Extraction from Visually-rich Documents by Token Path PredictionChong Zhang, Ya Guo, Yi Tu, Huan Chen, Jinyang Tang, Huijia Zhu, Qi Zhang, Tao Gui. 13716-13730 [doi]

Empower Nested Boolean Logic via Self-Supervised Curriculum LearningHongqiu Wu, Linfeng Liu 0003, Hai Zhao, Min Zhang. 13731-13742 [doi]

The Sentiment Problem: A Critical Survey towards Deconstructing Sentiment AnalysisPranav Venkit, Mukund Srinath, Sanjana Gautam, Saranya Venkatraman, Vipul Gupta, Rebecca J. Passonneau, Shomir Wilson. 13743-13763 [doi]

Poisoning Retrieval Corpora by Injecting Adversarial PassagesZexuan Zhong, Ziqing Huang, Alexander Wettig, Danqi Chen. 13764-13775 [doi]

DADA: Dialect Adaptation via Dynamic Aggregation of Linguistic RulesYanchen Liu, William Held, Diyi Yang. 13776-13793 [doi]

Clustering Pseudo Language Family in Multilingual Translation Models with Fisher Information MatrixXinyu Ma, Xuebo Liu, Min Zhang. 13794-13804 [doi]

Unifying Discrete and Continuous Representations for Unsupervised Paraphrase GenerationMingfeng Xue, Dayiheng Liu, Wenqiang Lei, Jie Fu, Jian Lan, Mei Li, Baosong Yang, Jun Xie, Yidan Zhang, Dezhong Peng, Jiancheng Lv. 13805-13822 [doi]

The Benefits of Label-Description Training for Zero-Shot Text ClassificationLingyu Gao, Debanjan Ghosh, Kevin Gimpel. 13823-13844 [doi]

Multilingual Pixel Representations for Translation and Effective Cross-lingual TransferElizabeth Salesky, Neha Verma 0001, Philipp Koehn, Matt Post. 13845-13861 [doi]

Finding Authentic Counterhate Arguments: A Case Study with Public FiguresAbdullah Albanyan, Ahmed Hassan, Eduardo Blanco 0002. 13862-13876 [doi]

Can We Edit Multimodal Large Language Models?Siyuan Cheng 0008, Bozhong Tian, Qingbin Liu, Xi Chen 0003, Yongheng Wang, Huajun Chen, Ningyu Zhang 0001. 13877-13888 [doi]

Exploring Discourse Structure in Document-level Machine TranslationXinyu Hu, Xiaojun Wan 0001. 13889-13902 [doi]

ClusterLLM: Large Language Models as a Guide for Text ClusteringYuwei Zhang 0001, Zihan Wang, Jingbo Shang. 13903-13920 [doi]

CodeBERTScore: Evaluating Code Generation with Pretrained Models of CodeShuyan Zhou, Uri Alon 0002, Sumit Agarwal, Graham Neubig. 13921-13937 [doi]

Learn and Consolidate: Continual Adaptation for Zero-Shot and Multilingual Neural Machine TranslationKaiyu Huang, Peng Li, Junpeng Liu, Maosong Sun, Yang Liu. 13938-13951 [doi]

e-THERAPIST: I suggest you to cultivate a mindset of positivity and nurture uplifting thoughtsKshitij Mishra, Priyanshu Priya, Manisha Burja, Asif Ekbal. 13952-13967 [doi]

AfriSenti: A Twitter Sentiment Analysis Benchmark for African LanguagesShamsuddeen Muhammad, Idris Abdulmumin, Abinew Ali Ayele, Nedjma Ousidhoum, David Ifeoluwa Adelani, Seid Muhie Yimam, Ibrahim Said Ahmad, Meriem Beloucif, Saif M. Mohammad, Sebastian Ruder, Oumaima Hourrane, Alípio Jorge, Pavel Brazdil, Felermino Dário Mário António Ali, Davis David, Salomey Osei, Bello Shehu Bello, Falalu Ibrahim Lawan, Tajuddeen Gwadabe, Samuel Rutunda, Tadesse Destaw Belay, Wendimu Baye Messelle, Hailu Beshada Balcha, Sisay Adugna Chala, Hagos Tesfahun Gebremichael, Bernard Opoku, Stephen Arthur. 13968-13981 [doi]

Quantifying Character Similarity with Vision TransformersXinmei Yang, Abhishek Arora 0003, Shao-Yu Jheng, Melissa Dell. 13982-13996 [doi]

Syllogistic Reasoning for Legal Judgment AnalysisWentao Deng, Jiahuan Pei, Keyi Kong, Zhe Chen, Furu Wei, Yujun Li, Zhaochun Ren, Zhumin Chen, Pengjie Ren. 13997-14009 [doi]

Improving Transformer-based Program Repair Model through False Behavior DiagnosisYoungKyoung Kim, Misoo Kim, Eunseok Lee 0001. 14010-14023 [doi]

SUT: Active Defects Probing for Transcompiler ModelsMengNan Qi, Yufan Huang, Maoquan Wang, Yongqiang Yao, Zihan Liu, Bin Gu, Colin Clement, Neel Sundaresan. 14024-14034 [doi]

KCTS: Knowledge-Constrained Tree Search Decoding with Token-Level Hallucination DetectionSehyun Choi, Tianqing Fang, Zhaowei Wang 0003, Yangqiu Song. 14035-14053 [doi]

CRUSH4SQL: Collective Retrieval Using Schema Hallucination For Text2SQLMayank Kothyari, Dhruva Dhingra, Sunita Sarawagi, Soumen Chakrabarti. 14054-14066 [doi]

This Reads Like That: Deep Learning for Interpretable Natural Language ProcessingClaudio Fanconi, Moritz Vandenhirtz, Severin Husmann, Julia E. Vogt. 14067-14076 [doi]

Incorporating Structured Representations into Pretrained Vision & Language Models Using Scene GraphsRoei Herzig, Alon Mendelson, Leonid Karlinsky, Assaf Arbelle, Rogério Feris, Trevor Darrell, Amir Globerson. 14077-14098 [doi]

TLM: Token-Level Masking for TransformersYangjun Wu, Kebin Fang, Dongxiang Zhang, Han Wang, Hao Zhang, Gang Chen 0001. 14099-14111 [doi]

Addressing NER Annotation Noises with Uncertainty-Guided Tree-Structured CRFsJian Liu, Weichang Liu, Yufeng Chen, Jinan Xu, Zhe Zhao. 14112-14123 [doi]

Hi Guys or Hi Folks? Benchmarking Gender-Neutral Machine Translation with the GeNTE CorpusAndrea Piergentili, Beatrice Savoldi, Dennis Fucci, Matteo Negri, Luisa Bentivogli. 14124-14140 [doi]

Multilingual Holistic Bias: Extending Descriptors and Patterns to Unveil Demographic Biases in Languages at ScaleMarta R. Costa-Jussà, Pierre Andrews, Eric Smith, Prangthip Hansanti, Christophe Ropers, Elahe Kalbassi, Cynthia Gao, Daniel Licht, Carleigh Wood. 14141-14156 [doi]

GlobalBench: A Benchmark for Global Progress in Natural Language ProcessingYueqi Song, Simran Khanuja, Pengfei Liu 0003, Fahim Faisal, Alissa Ostapenko, Genta Winata, Alham Fikri Aji, Samuel Cahyawijaya, Yulia Tsvetkov, Antonios Anastasopoulos, Graham Neubig. 14157-14171 [doi]

DetGPT: Detect What You Need via ReasoningRenjie Pi, Jiahui Gao, Shizhe Diao, Rui Pan, Hanze Dong, Jipeng Zhang, Lewei Yao, Jianhua Han, Hang Xu, Lingpeng Kong, Tong Zhang. 14172-14189 [doi]

Language Models with RationalityNora Kassner, Oyvind Tafjord, Ashish Sabharwal, Kyle Richardson 0001, Hinrich Schütze, Peter Clark. 14190-14201 [doi]

Self-Improvement of Non-autoregressive Model via Sequence-Level DistillationYusheng Liao, Shuyang Jiang, Yiqi Li, Yu Wang, Yanfeng Wang. 14202-14212 [doi]

Mitigating Temporal Misalignment by Discarding Outdated FactsMichael Zhang, Eunsol Choi. 14213-14226 [doi]

Open-world Semi-supervised Generalized Relation Discovery Aligned in a Real-world SettingWilliam Hogan, Jiacheng Li, Jingbo Shang. 14227-14242 [doi]

IEKG: A Commonsense Knowledge Graph for Idiomatic ExpressionsZiheng Zeng, Kellen Cheng, Srihari Nanniyur, Jianing Zhou, Suma Bhat. 14243-14264 [doi]

Bias Neutralization in Non-Parallel Texts: A Cyclic Approach with Auxiliary GuidanceKarthic Madanagopal, James Caverlee. 14265-14278 [doi]

Fighting Fire with Fire: The Dual Role of LLMs in Crafting and Detecting Elusive DisinformationJason Samuel Lucas, Adaku Uchendu, Michiharu Yamashita, Jooyoung Lee, Shaurya Rohatgi, Dongwon Lee 0001. 14279-14305 [doi]

SMoP: Towards Efficient and Effective Prompt Tuning with Sparse Mixture-of-PromptsJoon-Young Choi, Junho Kim, Jun-Hyung Park, Wing-Lam Mok, SangKeun Lee 0001. 14306-14316 [doi]

BRAINTEASER: Lateral Thinking Puzzles for Large Language ModelsYifan Jiang 0001, Filip Ilievski, Kaixin Ma, Zhivar Sourati. 14317-14332 [doi]

When are Lemons Purple? The Concept Association Bias of Vision-Language ModelsYingtian Tang, Yutaro Yamada, Yoyo Zhang, Ilker Yildirim. 14333-14348 [doi]

What Comes Next? Evaluating Uncertainty in Neural Text Generators Against Human Production VariabilityMario Giulianelli, Joris Baan, Wilker Aziz, Raquel Fernández, Barbara Plank. 14349-14371 [doi]

Text Representation Distillation via Information Bottleneck PrincipleYanzhao Zhang, Dingkun Long, Zehan Li, Pengjun Xie. 14372-14383 [doi]

Let GPT be a Math Tutor: Teaching Math Word Problem Solvers with Customized Exercise GenerationZhenwen Liang, Wenhao Yu 0002, Tanmay Rajpurohit, Peter Clark, Xiangliang Zhang 0001, Ashwin Kalyan. 14384-14396 [doi]

FANToM: A Benchmark for Stress-testing Machine Theory of Mind in InteractionsHyunwoo Kim 0002, Melanie Sclar, Xuhui Zhou, Ronan Le Bras 0001, Gunhee Kim, Yejin Choi 0001, Maarten Sap. 14397-14413 [doi]

Exploring the Boundaries of GPT-4 in RadiologyQianchu Liu, Stephanie L. Hyland, Shruthi Bannur, Kenza Bouzid, Daniel C. Castro, Maria Wetscherek, Robert Tinn, Harshita Sharma, Fernando Pérez-García, Anton Schwaighofer, Pranav Rajpurkar, Sameer Tajdin Khanna, Hoifung Poon, Naoto Usuyama, Anja Thieme, Aditya V. Nori, Matthew P. Lungren, Ozan Oktay, Javier Alvarez-Valle. 14414-14445 [doi]

A Frustratingly Easy Post-Training Quantization Scheme for LLMsYongkweon Jeon, Chungman Lee, Kyungphil Park, Ho Young Kim. 14446-14461 [doi]

A Comprehensive Evaluation of Biomedical Entity Linking ModelsDavid Kartchner, Jennifer Deng, Shubham Lohiya, Tejasri Kopparthi, Prasanth Bathala, Daniel Domingo-Fernández, Cassie S. Mitchell. 14462-14478 [doi]

Exploring Jiu-Jitsu Argumentation for Writing Peer Review RebuttalsSukannya Purkayastha, Anne Lauscher, Iryna Gurevych. 14479-14495 [doi]

LIMIT: Language Identification, Misidentification, and Translation using Hierarchical Models in 350+ LanguagesMilind Agarwal, Md Mahfuz Ibn Alam, Antonios Anastasopoulos. 14496-14519 [doi]

FreeAL: Towards Human-Free Active Learning in the Era of Large Language ModelsRuixuan Xiao, Yiwen Dong 0003, Junbo Zhao, Runze Wu, Minmin Lin, Gang Chen, Haobo Wang. 14520-14535 [doi]

API-Assisted Code Generation for Question Answering on Varied Table StructuresYihan Cao, Shuyi Chen, Ryan Liu, Zhiruo Wang, Daniel Fried. 14536-14548 [doi]

Data Factors for Better Compositional GeneralizationXiang Zhou, Yichen Jiang, Mohit Bansal. 14549-14566 [doi]

ChatEdit: Towards Multi-turn Interactive Facial Image Editing via DialogueXing Cui, Zekun Li 0008, Pei Li, Yibo Hu, Hailin Shi, Chunshui Cao, Zhaofeng He. 14567-14583 [doi]

Bridging Continuous and Discrete Spaces: Interpretable Sentence Representation Learning via Compositional OperationsJames Y. Huang, Wenlin Yao, Kaiqiang Song, Hongming Zhang, Muhao Chen, Dong Yu 0001. 14584-14595 [doi]

Outlier Dimensions Encode Task Specific KnowledgeWilliam Rudman, Catherine Chen, Carsten Eickhoff. 14596-14605 [doi]

Hi-ArG: Exploring the Integration of Hierarchical Argumentation Graphs in Language PretrainingJingcong Liang, Rong Ye, Meng Han, Qi Zhang, Ruofei Lai, Xinyu Zhang, Zhao Cao, Xuanjing Huang, Zhongyu Wei. 14606-14620 [doi]

Biomedical Named Entity Recognition via Dictionary-based Synonym GeneralizationZihao Fu, Yixuan Su, Zaiqiao Meng, Nigel Collier. 14621-14635 [doi]

GNAT: A General Narrative Alignment ToolTanzir Pial, Steven Skiena. 14636-14652 [doi]

Self-Ensemble of N-best Generation Hypotheses by Lexically Constrained DecodingRyota Miyano, Tomoyuki Kajiwara, Yuki Arase. 14653-14661 [doi]

UniChart: A Universal Vision-language Pretrained Model for Chart Comprehension and ReasoningAhmed Masry, Parsa Kavehzadeh, Do Xuan Long, Enamul Hoque, Shafiq Joty. 14662-14684 [doi]

Merging Experts into One: Improving Computational Efficiency of Mixture of ExpertsShwai He, Run-Ze Fan, Liang Ding 0006, Li Shen, Tianyi Zhou 0001, Dacheng Tao. 14685-14691 [doi]

Distance-Based Propagation for Efficient Knowledge Graph ReasoningHarry Shomer, Yao Ma 0001, Juanhui Li, Bo Wu, Charu C. Aggarwal, Jiliang Tang. 14692-14707 [doi]

What to Read in a Contract? Party-Specific Summarization of Legal Obligations, Entitlements, and ProhibitionsAbhilasha Sancheti, Aparna Garimella, Balaji Vasan Srinivasan, Rachel Rudinger. 14708-14725 [doi]

Enhancing Computation Efficiency in Large Language Models through Weight and Activation QuantizationJanghwan Lee, Minsoo Kim, Seungcheol Baek, Seok Joong Hwang, Wonyong Sung, Jungwook Choi. 14726-14739 [doi]

CP-BCS: Binary Code Summarization Guided by Control Flow Graph and Pseudo CodeTong Ye, Lingfei Wu, Tengfei Ma 0001, Xuhong Zhang 0002, Yangkai Du, Peiyu Liu 0003, Shouling Ji, Wenhai Wang. 14740-14752 [doi]

Assessing Step-by-Step Reasoning against Lexical Negation: A Case Study on SyllogismMengyu Ye, Tatsuki Kuribayashi, Jun Suzuki, Goro Kobayashi, Hiroaki Funayama. 14753-14773 [doi]

Chain-of-Thought Tuning: Masked Language Models can also Think Step By Step in Natural Language UnderstandingCaoyun Fan, Jidong Tian, Yitian Li, Wenqing Chen, Hao He 0007, Yaohui Jin. 14774-14785 [doi]

Large Language Models are Complex Table ParsersBowen Zhao, Changkai Ji, Yuejie Zhang, Wen He, Yingwen Wang, Qing Wang, Rui Feng, Xiaobo Zhang. 14786-14802 [doi]

R2H: Building Multimodal Navigation Helpers that Respond to Help RequestsYue Fan, Jing Gu, Kaizhi Zheng, Xin Wang. 14803-14819 [doi]

Speech-enriched Memory for Inference-time Adaptation of ASR Models to Word DictionariesAshish R. Mittal, Sunita Sarawagi, Preethi Jyothi, George Saon, Gakuto Kurata. 14820-14835 [doi]

Generative Table Pre-training Empowers Models for Tabular PredictionTianping Zhang, Shaowen Wang, Shuicheng Yan, Li Jian, Qian Liu. 14836-14854 [doi]

Learning to Describe for Predicting Zero-shot Drug-Drug InteractionsFangqi Zhu, Yongqi Zhang, Lei Chen, Bing Qin 0001, Ruifeng Xu. 14855-14870 [doi]

A Simple Baseline for Knowledge-Based Visual Question AnsweringAlexandros Xenos, Themos Stafylakis, Ioannis Patras, Georgios Tzimiropoulos. 14871-14877 [doi]

Unveiling the Essence of Poetry: Introducing a Comprehensive Dataset and Benchmark for Poem SummarizationRidwan Mahbub, Ifrad Khan, Samiha Anuva, Md Shahriar, Md. Tahmid Rahman Laskar, Sabbir Ahmed. 14878-14886 [doi]

Privacy Implications of Retrieval-Based Language ModelsYangsibo Huang, Samyak Gupta, Zexuan Zhong, Kai Li, Danqi Chen. 14887-14902 [doi]

IMTLab: An Open-Source Platform for Building, Evaluating, and Diagnosing Interactive Machine Translation SystemsXu Huang, Zhirui Zhang, Ruize Gao, Yichao Du, Lemao Liu, Guoping Huang, Shuming Shi 0001, Jiajun Chen, Shujian Huang. 14903-14917 [doi]

Is ChatGPT Good at Search? Investigating Large Language Models as Re-Ranking AgentsWeiwei Sun 0001, Lingyong Yan, Xinyu Ma, Shuaiqiang Wang, Pengjie Ren, Zhumin Chen, Dawei Yin, Zhaochun Ren. 14918-14937 [doi]

DiNeR: A Large Realistic Dataset for Evaluating Compositional GeneralizationChenGang Hu, Xiao Liu, Yansong Feng. 14938-14947 [doi]

Can Pre-trained Vision and Language Models Answer Visual Information-Seeking Questions?Yang Chen, Hexiang Hu, Yi Luan, Haitian Sun, Soravit Changpinyo, Alan Ritter, Ming-Wei Chang. 14948-14968 [doi]

EDeR: Towards Understanding Dependency Relations Between EventsRuiqi Li, Patrik Haslum, Leyang Cui. 14969-14983 [doi]

It Ain't Over: A Multi-aspect Diverse Math Word Problem DatasetJiwoo Kim, Youngbin Kim, Ilwoong Baek, JinYeong Bak, Jongwuk Lee. 14984-15011 [doi]

Dr ChatGPT tell me what I want to hear: How different prompts impact health answer correctnessBevan Koopman, Guido Zuccon. 15012-15022 [doi]

kNN-LM Does Not Improve Open-ended Text GenerationShufan Wang, Yixiao Song, Andrew Drozdov, Aparna Garimella, Varun Manjunatha, Mohit Iyyer. 15023-15037 [doi]

Towards A Unified View of Sparse Feed-Forward Network in Pretraining Large Language ModelZeyu Liu, Tim Dettmers, Xi Lin, Veselin Stoyanov, Xian Li. 15038-15061 [doi]

Exploring the Impact of Model Scaling on Parameter-Efficient TuningYusheng Su, Chi-Min Chan, Jiali Cheng, Yujia Qin, Yankai Lin, Shengding Hu, Zonghan Yang, Ning Ding, Xingzhi Sun, Guotong Xie, Zhiyuan Liu, Maosong Sun 0001. 15062-15078 [doi]

STAIR: Learning Sparse Text and Image Representation in Grounded TokensChen Chen, Bowen Zhang, Liangliang Cao, Jiguang Shen, Tom Gunter, Albin Madappally Jose, Alexander Toshev, Yantao Zheng, Jonathon Shlens, Ruoming Pang, Yinfei Yang. 15079-15094 [doi]

Crossing the Threshold: Idiomatic Machine Translation through Retrieval Augmentation and Loss WeightingEmmy Liu, Aditi Chaudhary, Graham Neubig. 15095-15111 [doi]

CoRec: An Easy Approach for Coordination RecognitionQing Wang, Haojie Jia, Wenfei Song, Qi Li. 15112-15120 [doi]

A linear time approximation of Wasserstein distance with word embedding selectionSho Otao, Makoto Yamada. 15121-15134 [doi]

Exchange-of-Thought: Enhancing Large Language Model Capabilities through Cross-Model CommunicationZhangyue Yin, Qiushi Sun, Cheng Chang, Qipeng Guo, Junqi Dai, Xuanjing Huang, Xipeng Qiu. 15135-15153 [doi]

Conversation Understanding using Relational Temporal Graph Neural Networks with Auxiliary Cross-Modality InteractionCam-Van Thi Nguyen, Anh-Tuan Mai, The-Son Le, Hai-Dang Kieu, Duc-Trong Le. 15154-15167 [doi]

Connecting degree and polarity: An artificial language learning studyLisa Bylinina, Alexey Tikhonov, Ekaterina Garmash. 15168-15177 [doi]

Prompting with Pseudo-Code InstructionsMayank Mishra, Prince Kumar, Riyaz Bhat, Rudra Murthy V, Danish Contractor, Srikanth Tamilselvam. 15178-15197 [doi]

CRAB: Assessing the Strength of Causal Relationships Between Real-world EventsAngelika Romanou, Syrielle Montariol, Debjit Paul, Leo Laugier, Karl Aberer, Antoine Bosselut. 15198-15216 [doi]

NORMSAGE: Multi-Lingual Multi-Cultural Norm Discovery from Conversations On-the-FlyYi Fung 0001, Tuhin Chakrabarty, Hao Guo, Owen Rambow, Smaranda Muresan, Heng Ji. 15217-15230 [doi]

A State-Vector Framework for Dataset EffectsEsmat Sahak, Zining Zhu 0001, Frank Rudzicz. 15231-15245 [doi]

Challenges in Context-Aware Neural Machine TranslationLinghao Jin, Jacqueline He, Jonathan May, Xuezhe Ma. 15246-15263 [doi]

Task-Adaptive Tokenization: Enhancing Long-Form Text Generation Efficacy in Mental Health and BeyondSiyang Liu 0003, Naihao Deng, Sahand Sabour, Yilin Jia, Minlie Huang, Rada Mihalcea. 15264-15281 [doi]

FACTIFY3M: A benchmark for multimodal fact verification with explainability through 5W Question-AnsweringMegha Chakraborty, Khushbu Pahwa, Anku Rani, Shreyas Chatterjee, Dwip Dalal, Harshit Dave, Ritvik G, Preethi Gurumurthy, Adarsh Mahor, Samahriti Mukherjee, Aditya Pakala, Ishan Paul, Janvita Reddy, Arghya Sarkar, Kinjal Sensharma, Aman Chadha, Amit P. Sheth, Amitava Das. 15282-15322 [doi]

Building Multi-domain Dialog State Trackers from Single-domain DialogsQi Zhu 0007, Zheng Zhang, Xiaoyan Zhu 0001, Minlie Huang. 15323-15335 [doi]

Specialist or Generalist? Instruction Tuning for Specific NLP TasksChufan Shi, Yixuan Su, Cheng Yang, Yujiu Yang, Deng Cai 0002. 15336-15348 [doi]

Making Large Language Models Better Data CreatorsDong-Ho Lee, Jay Pujara, Mohit Sewak, Ryen White, Sujay Kumar Jauhar. 15349-15360 [doi]

Hallucination Detection for Generative Large Language Models by Bayesian Sequential EstimationXiaohua Wang, Yuliang Yan, Longtao Huang, Xiaoqing Zheng, Xuanjing Huang. 15361-15371 [doi]

Guideline Learning for In-Context Information ExtractionChaoxu Pang, Yixuan Cao, Qiang Ding, Ping Luo 0001. 15372-15389 [doi]

Open Information Extraction via ChunksKuicai Dong, Aixin Sun, Jung-Jae Kim 0001, Xiaoli Li 0001. 15390-15404 [doi]

Rethinking Word-Level Auto-Completion in Computer-Aided TranslationXingyu Chen, Lemao Liu, Guoping Huang, Zhirui Zhang, Mingming Yang, Shuming Shi, Rui Wang. 15405-15415 [doi]

Automatic Transcription of Handwritten Old Occitan LanguageEsteban Garces Arias, Vallari Pai, Matthias Schöffel, Christian Heumann, Matthias Aßnmacher. 15416-15439 [doi]

CorefPrompt: Prompt-based Event Coreference Resolution by Measuring Event Type and Argument CompatibilitiesSheng Xu 0006, Peifeng Li, Qiaoming Zhu. 15440-15452 [doi]

Anaphor Assisted Document-Level Relation ExtractionChonggang Lu, Richong Zhang, Kai Sun, Jaein Kim, Cunwang Zhang, Yongyi Mao. 15453-15464 [doi]

FinEntity: Entity-level Sentiment Classification for Financial TextsYixuan Tang, Yi Yang, Allen Huang, Andy Tam, Justin Z. Tang. 15465-15471 [doi]

All Things Considered: Detecting Partisan Events from News Media with Cross-Article ComparisonYujian Liu, Xinliang Frederick Zhang, Kaijian Zou, Ruihong Huang, Nicholas Beauchamp, Lu Wang. 15472-15488 [doi]

Rationale-Enhanced Language Models are Better Continual Relation LearnersWeimin Xiong, Yifan Song, Peiyi Wang, Sujian Li. 15489-15497 [doi]

BanglaAbuseMeme: A Dataset for Bengali Abusive Meme ClassificationMithun Das, Animesh Mukherjee 0001. 15498-15512 [doi]

ScanDL: A Diffusion Model for Generating Synthetic Scanpaths on TextsLena S. Bolliger, David R. Reich, Patrick Haller 0001, Deborah N. Jakobi, Paul Prasse, Lena A. Jäger. 15513-15538 [doi]

From Values to Opinions: Predicting Human Behaviors and Stances Using Value-Injected Large Language ModelsDongjun Kang, Joonsuk Park, Yohan Jo, JinYeong Bak. 15539-15559 [doi]

Analyzing Film Adaptation through Narrative AlignmentTanzir Pial, Shahreen Salim Aunti, Charuta Pethe, Allen Kim, Steven Skiena. 15560-15579 [doi]

Inverse Scaling Can Become U-ShapedJason Wei, Najoung Kim, Yi Tay, Quoc Le. 15580-15591 [doi]

Nearest Neighbor Machine Translation is Meta-Optimizer on Output Projection LayerRuize Gao, Zhirui Zhang, Yichao Du, Lemao Liu, Rui Wang. 15592-15608 [doi]

Variance Matters: Detecting Semantic Differences without Corpus/Word AlignmentRyo Nagata, Hiroya Takamura, Naoki Otani, Yoshifumi Kawasaki. 15609-15622 [doi]

MolCA: Molecular Graph-Language Modeling with Cross-Modal Projector and Uni-Modal AdapterZhiyuan Liu, Sihang Li, Yanchen Luo, Hao Fei 0001, Yixin Cao 0002, Kenji Kawaguchi, Xiang Wang 0010, Tat-Seng Chua. 15623-15638 [doi]

A Training-Free Debiasing Framework with Counterfactual Reasoning for Conversational Emotion DetectionGeng Tu, Ran Jing, Bin Liang, Min Yang, Kam-Fai Wong, Ruifeng Xu. 15639-15650 [doi]

Self-ICL: Zero-Shot In-Context Learning with Self-Generated DemonstrationsWei-Lin Chen, Cheng-Kuang Wu, Yun-Nung Chen, Hsin-Hsi Chen. 15651-15662 [doi]

Learning Knowledge-Enhanced Contextual Language Representations for Domain Natural Language UnderstandingTaolin Zhang, Ruyao Xu, Chengyu Wang 0001, Zhongjie Duan, Cen Chen, Minghui Qiu, Dawei Cheng, Xiaofeng He, Weining Qian. 15663-15676 [doi]

ScdNER: Span-Based Consistency-Aware Document-Level Named Entity RecognitionYing Wei, Qi Li. 15677-15685 [doi]

MQuAKE: Assessing Knowledge Editing in Language Models via Multi-Hop QuestionsZexuan Zhong, Zhengxuan Wu, Christopher D. Manning, Christopher Potts, Danqi Chen. 15686-15702 [doi]

Stance Detection on Social Media with Background KnowledgeAng Li, Bin Liang, Jingqian Zhao, Bowen Zhang, Min Yang, Ruifeng Xu. 15703-15717 [doi]

Vision-Enhanced Semantic Entity Recognition in Document Images via Visually-Asymmetric Consistency LearningHao Wang, Xiahua Chen, Rui Wang, Chenhui Chu. 15718-15731 [doi]

NormDial: A Comparable Bilingual Synthetic Dialog Dataset for Modeling Social Norm Adherence and ViolationOliver Li, Mallika Subramanian, Arkadiy Saakyan, Sky CH-Wang, Smaranda Muresan. 15732-15744 [doi]

ClimateBERT-NetZero: Detecting and Assessing Net Zero and Reduction TargetsTobias Schimanski, Julia Anna Bingler, Mathias Kraus, Camilla Hyslop, Markus Leippold. 15745-15756 [doi]

Leap-of-Thought: Accelerating Transformers via Dynamic Token RoutingYeachan Kim, Junho Kim, Jun-Hyung Park, Mingyu Lee, SangKeun Lee 0001. 15757-15769 [doi]

Reinforcement Replaces Supervision: Query focused Summarization using Deep Reinforcement LearningSwaroop Nath, Pushpak Bhattacharyya, Harshad Khadilkar. 15770-15789 [doi]

Fair Text Classification with Wasserstein IndependenceThibaud Leteno, Antoine Gourru, Charlotte Laclau, Rémi Emonet, Christophe Gravier. 15790-15803 [doi]

TacoPrompt: A Collaborative Multi-Task Prompt Learning Method for Self-Supervised Taxonomy CompletionHongyuan Xu, Ciyi Liu, Yuhang Niu, Yunong Chen, Xiangrui Cai, Yanlong Wen, Xiaojie Yuan. 15804-15817 [doi]

An Attribution Method for Siamese EncodersLucas Möller, Dmitry Nikolaev 0003, Sebastian Padó. 15818-15827 [doi]

Global Voices, Local Biases: Socio-Cultural Prejudices across LanguagesAnjishnu Mukherjee, Chahat Raj, Ziwei Zhu 0001, Antonios Anastasopoulos. 15828-15845 [doi]

Graph vs. Sequence: An Empirical Study on Knowledge Forms for Knowledge-Grounded DialogueYizhe Yang, Heyan Huang, Yuhang Liu, Yang Gao. 15846-15858 [doi]

Are Compressed Language Models Less Subgroup Robust?Leonidas Gee, Andrea Zugarini, Novi Quadrianto. 15859-15868 [doi]

Length Does Matter: Summary Length can Bias Summarization MetricsXiaobo Guo, Soroush Vosoughi. 15869-15879 [doi]

NL2TL: Transforming Natural Languages to Temporal Logics using Large Language ModelsYongchao Chen, Rujul Gandhi, Yang Zhang, Chuchu Fan. 15880-15903 [doi]

Reformulating NLP tasks to Capture Longitudinal Manifestation of Language Disorders in People with DementiaDimitris Gkoumas, Matthew Purver, Maria Liakata. 15904-15917 [doi]

Elevating Code-mixed Text Handling through Auditory Information of WordsMamta, Zishan Ahmad, Asif Ekbal. 15918-15932 [doi]

Predict and Use: Harnessing Predicted Gaze to Improve Multimodal Sarcasm DetectionDivyank Tiwari, Diptesh Kanojia, Anupama Ray, Apoorva Nunna, Pushpak Bhattacharyya. 15933-15948 [doi]

Fine-grained Medical Vision-Language Representation Learning for Radiology Report GenerationSiyuan Wang, Bo Peng, Yichao Liu, Qi Peng. 15949-15956 [doi]

ViT-TTS: Visual Text-to-Speech with Scalable Diffusion TransformerHuadai Liu, Rongjie Huang, Xuan Lin, Wenqiang Xu, Maozong Zheng, Hong Chen, Jinzheng He, Zhou Zhao. 15957-15969 [doi]

Consistency Analysis of ChatGPTMyeongjun Jang, Thomas Lukasiewicz. 15970-15985 [doi]

Do Differences in Values Influence Disagreements in Online Discussions?Michiel van der Meer, Piek Vossen, Catholijn M. Jonker, Pradeep K. Murukannaiah. 15986-16008 [doi]

Automated Fact-Checking in Dialogue: Are Specialized Models Needed?Eric Chamoun, Marzieh Saeidi, Andreas Vlachos 0001. 16009-16020 [doi]

A Digital Language Coherence Marker for Monitoring DementiaDimitris Gkoumas, Adam Tsakalidis, Maria Liakata. 16021-16034 [doi]

Detecting Spoilers in Movie Reviews with External Movie Knowledge and User NetworksHeng Wang, Wenqian Zhang, Yuyang Bai, Zhaoxuan Tan, Shangbin Feng, Qinghua Zheng, Minnan Luo. 16035-16050 [doi]

Joyful: Joint Modality Fusion and Graph Contrastive Learning for Multimoda Emotion RecognitionDongyuan Li, Yusong Wang, Kotaro Funakoshi, Manabu Okumura. 16051-16069 [doi]

HyperRank: Hyperbolic Ranking Model for Unsupervised Keyphrase ExtractionMingYang Song, Huafeng Liu 0001, Liping Jing. 16070-16080 [doi]

Assessing the influence of attractor-verb distance on grammatical agreement in humans and language modelsChristos-Nikolaos Zacharopoulos, Théo Desbordes, Mathias Sablé-Meyer. 16081-16090 [doi]

Federated Meta-Learning for Emotion and Sentiment Aware Multi-modal Complaint IdentificationApoorva Singh, Siddarth Chandrasekar, Sriparna Saha 0001, Tanmay Sen. 16091-16103 [doi]

Semantic Similarity Models for Depression Severity EstimationAnxo Pérez, Neha Warikoo, Kexin Wang, Javier Parapar, Iryna Gurevych. 16104-16118 [doi]

Hop, Union, Generate: Explainable Multi-hop Reasoning without Rationale SupervisionWenting Zhao, Justin T. Chiu, Claire Cardie, Alexander M. Rush. 16119-16130 [doi]

To Split or Not to Split: Composing Compounds in Contextual Vector SpacesChristopher Jenkins, Filip Miletic 0002, Sabine Schulte im Walde. 16131-16136 [doi]

ToolWriter: Question Specific Tool Synthesis for Tabular DataCarlos Gemmell, Jeff Dalton 0001. 16137-16148 [doi]

Interactive Text-to-SQL Generation via Editable Step-by-Step ExplanationsYuan Tian, Zheng Zhang, Zheng Ning, Toby Jia-Jun Li, Jonathan K. Kummerfeld, Tianyi Zhang 0001. 16149-16166 [doi]

CoCo: Coherence-Enhanced Machine-Generated Text Detection Under Low Resource With Contrastive LearningXiaoming Liu, Zhaohan Zhang, Yichen Wang, Hang Pu, Yu Lan, Chao Shen 0001. 16167-16188 [doi]

AnyTOD: A Programmable Task-Oriented Dialog SystemJeffrey Zhao, Yuan Cao 0007, Raghav Gupta, Harrison Lee 0001, Abhinav Rastogi, Mingqiu Wang, Hagen Soltau, Izhak Shafran, Yonghui Wu. 16189-16204 [doi]

Can LMs Generalize to Future Data? An Empirical Analysis on Text SummarizationChi Seng Cheang, Hou Pong Chan, Derek F. Wong, Xuebo Liu 0002, Zhaocong Li, Yanming Sun, Shudong Liu 0004, Lidia S. Chao. 16205-16217 [doi]

Zero-Shot Multi-Label Topic Inference with Sentence Encoders and LLMsSouvika Sarkar, Dongji Feng, Shubhra Kanti Karmaker Santu. 16218-16233 [doi]

TaskDiff: A Similarity Metric for Task-Oriented ConversationsAnkita Bhaumik, Praveen Venkateswaran, Yara Rizk, Vatche Isahagian. 16234-16240 [doi]

Not all Fake News is Written: A Dataset and Analysis of Misleading Video HeadlinesYoo yeon Sung, Jordan L. Boyd-Graber, Naeemul Hassan. 16241-16258 [doi]

Learning From Free-Text Human Feedback - Collect New Datasets Or Extend Existing Ones?Dominic Petrak, Nafise Sadat Moosavi, Ye Tian, Nikolai Rozanov, Iryna Gurevych. 16259-16279 [doi]

Euphemistic Abuse - A New Dataset and Classification Experiments for Implicitly Abusive LanguageMichael Wiegand, Jana Kampfmeier, Elisabeth Eder, Josef Ruppenhofer. 16280-16297 [doi]

Exploring Distributional Shifts in Large Language Models for Code AnalysisShushan Arakelyan, Rocktim Jyoti Das, Yi Mao, Xiang Ren. 16298-16314 [doi]

ATHENA: Mathematical Reasoning with Thought ExpansionJB. Kim, Hazel Kim, Joonghyuk Hahn, Yo-Sub Han. 16315-16327 [doi]

A Benchmark for Reasoning with Spatial PrepositionsIulia M. Comsa, Srini Narayanan. 16328-16335 [doi]

TIMELINE: Exhaustive Annotation of Temporal Relations Supporting the Automatic Ordering of Events in News ArticlesSarah Alsayyahi, Riza Batista-Navarro. 16336-16348 [doi]

Mitigating Over-Generation for Unsupervised Keyphrase Extraction with Heterogeneous Centrality DetectionMingYang Song, Pengyu Xu, Yi Feng, Huafeng Liu, Liping Jing. 16349-16359 [doi]

Towards Interpretable and Efficient Automatic Reference-Based Summarization EvaluationYixin Liu, Alexander R. Fabbri, Yilun Zhao 0001, Pengfei Liu, Shafiq Joty, Chien-Sheng Wu, Caiming Xiong, Dragomir Radev. 16360-16368 [doi]

MAUD: An Expert-Annotated Legal NLP Dataset for Merger Agreement UnderstandingSteven H. Wang, Antoine Scardigli, Leonard Tang, Wei Chen, Dimitry Levkin, Anya Chen, Spencer Ball, Thomas Woodside, Oliver Zhang, Dan Hendrycks. 16369-16382 [doi]

PK-ICR: Persona-Knowledge Interactive Multi-Context Retrieval for Grounded DialogueMinsik Oh, Joosung Lee, Jiwei Li, Guoyin Wang. 16383-16395 [doi]

More Than Spoken Words: Nonverbal Message Extraction and GenerationDian Yu, Xiaoyang Wang, Wanshun Chen, Nan Du, Longyue Wang, Haitao Mi, Dong Yu. 16396-16413 [doi]

Can language models learn analogical reasoning? Investigating training objectives and comparisons to human performanceMolly R. Petersen, Lonneke van der Plas. 16414-16425 [doi]

FAME: Flexible, Scalable Analogy Mappings EngineShahar Jacob, Chen Shani, Dafna Shahaf. 16426-16442 [doi]

A Self-training Framework for Automated Medical Report GenerationSiyuan Wang, Zheng Liu, Bo Peng. 16443-16449 [doi]

A Picture is Worth a Thousand Words: Language Models Plan from PixelsAnthony Liu, Lajanugen Logeswaran, Sungryull Sohn, Honglak Lee. 16450-16459 [doi]

Interpreting and Exploiting Functional Specialization in Multi-Head Attention under Multi-task LearningChong Li, Shaonan Wang, Yunhao Zhang, Jiajun Zhang, Chengqing Zong. 16460-16476 [doi]

Multilingual Previously Fact-Checked Claim RetrievalMatús Pikuliak, Ivan Srba, Róbert Móro, Timo Hromadka, Timotej Smolen, Martin Melisek, Ivan Vykopal, Jakub Simko, Juraj Podrouzek, Mária Bieliková. 16477-16500 [doi]

ALCAP: Alignment-Augmented Music CaptionerZihao He, Weituo Hao, Wei Tsung Lu, Changyou Chen, Kristina Lerman, Xuchen Song. 16501-16512 [doi]

Do Transformers Parse while Predicting the Masked Word?Haoyu Zhao, Abhishek Panigrahi, Rong Ge 0001, Sanjeev Arora. 16513-16542 [doi]

Composable Text Controls in Latent Space with ODEsGuangyi Liu, Zeyu Feng, Yuan Gao, Zichao Yang, Xiaodan Liang, Junwei Bao 0001, Xiaodong He, Shuguang Cui, Zhen Li, Zhiting Hu. 16543-16570 [doi]

P5: Plug-and-Play Persona Prompting for Personalized Response SelectionJoosung Lee, Minsik Oh, Donghun Lee. 16571-16582 [doi]

Reader: Model-based language-instructed reinforcement learningNicola Dainese, Pekka Marttinen, Alexander Ilin. 16583-16599 [doi]

Adapting Offline Speech Translation Models for Streaming with Future-Aware Distillation and InferenceBiao Fu, Minpeng Liao, Kai Fan, Zhongqiang Huang, Boxing Chen, Yidong Chen, Xiaodong Shi. 16600-16619 [doi]

Relation-aware Ensemble Learning for Knowledge Graph EmbeddingLing Yue, Yongqi Zhang, Quanming Yao, Yong Li, Xian Wu, Ziheng Zhang, Zhenxi Lin, Yefeng Zheng 0001. 16620-16631 [doi]

GenEx: A Commonsense-aware Unified Generative Framework for Explainable Cyberbullying DetectionKrishanu Maity, Raghav Jain, Prince Jha, Sriparna Saha 0001, Pushpak Bhattacharyya. 16632-16645 [doi]

Document-Level Machine Translation with Large Language ModelsLongyue Wang, Chenyang Lyu, Tianbo Ji, Zhirui Zhang, Dian Yu, Shuming Shi 0001, Zhaopeng Tu. 16646-16661 [doi]

Multilingual Simplification of Medical TextsSebastian Joseph, Kathryn Kazanas, Keziah Reina, Vishnesh J. Ramanathan, Wei Xu, Byron C. Wallace, Junyi Li. 16662-16692 [doi]

When Reviewers Lock Horns: Finding Disagreements in Scientific Peer ReviewsSandeep Kumar, Tirthankar Ghosal, Asif Ekbal. 16693-16704 [doi]

Argue with Me Tersely: Towards Sentence-Level Counter-Argument GenerationJiayu Lin, Rong Ye, Meng Han, Qi Zhang, Ruofei Lai, Xinyu Zhang, Zhao Cao, Xuanjing Huang, Zhongyu Wei. 16705-16720 [doi]

JASMINE: Arabic GPT Models for Few-Shot LearningEl Moatez Billah Nagoudi, Muhammad Abdul-Mageed, AbdelRahim A. Elmadany, Alcides Alcoba Inciarte, Md Tawkat Islam Khondaker. 16721-16744 [doi]

NLI4CT: Multi-Evidence Natural Language Inference for Clinical Trial ReportsMaël Jullien, Marco Valentino, Hannah Frost, Paul O'Regan, Dónal Landers, André Freitas. 16745-16764 [doi]

Addressing Linguistic Bias through a Contrastive Analysis of Academic Writing in the NLP DomainRobert Ridley, Zhen Wu, Jianbing Zhang, Shujian Huang, Xinyu Dai. 16765-16779 [doi]

RobustGEC: Robust Grammatical Error Correction Against Subtle Context PerturbationYue Zhang 0004, Leyang Cui, Enbo Zhao, Wei Bi, Shuming Shi 0001. 16780-16793 [doi]

Detecting Propaganda Techniques in Code-Switched Social Media TextMuhammad Umar Salman, Asif Hanif, Shady Shehata, Preslav Nakov. 16794-16812 [doi]

Speech Recognition and Meaning Interpretation: Towards Disambiguation of Structurally Ambiguous Spoken Utterances in IndonesianRuhiyah Widiaputri, Ayu Purwarianti, Dessi Puji Lestari, Kurniawati Azizah, Dipta Tanaya, Sakriani Sakti. 16813-16824 [doi]

Target-Agnostic Gender-Aware Contrastive Learning for Mitigating Bias in Multilingual Machine TranslationMinwoo Lee 0003, Hyukhun Koh, Kang Il Lee, DongDong Zhang, MinSung Kim, Kyomin Jung. 16825-16839 [doi]

Code-Switching Metrics Using Intonation UnitsRebecca Pattichis, Dora LaCasse, Sonya Trawick, Rena Cacoullos. 16840-16849 [doi]

External Links

Cite Key

Statistics

PDF

Researchr

Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing, EMNLP 2023, Singapore, December 6-10, 2023

Abstract

Table of Contents