Findings of the Association for Computational Linguistics, ACL 2024, Bangkok, Thailand and virtual meeting, August 11-16, 2024

researchr

You are not signed in
Sign in
Sign up

Lun-Wei Ku, Andre Martins, Vivek Srikumar, editors, Findings of the Association for Computational Linguistics, ACL 2024, Bangkok, Thailand and virtual meeting, August 11-16, 2024. Association for Computational Linguistics, 2014. [doi]

Conference: acl2014

Abstract is missing.

Frontmatter [doi]

Controllable Data Augmentation for Few-Shot Text Mining with Chain-of-Thought Attribute ManipulationLetian Peng, Yuwei Zhang 0001, Jingbo Shang. 1-16 [doi]

Match More, Extract Better! Hybrid Matching Model for Open Domain Web Keyphrase ExtractionMingYang Song, Liping Jing, Yi Feng. 17-27 [doi]

AFPQ: Asymmetric Floating Point Quantization for LLMsYijia Zhang, Sicheng Zhang, Shijie Cao, Dayou Du, Jianyu Wei, Ting Cao, Ningyi Xu. 28-36 [doi]

End-to-End Emotion Semantic ParsingXiaotong Jiang, Zhongqing Wang, Guodong Zhou. 37-47 [doi]

Overcoming Catastrophic Forgetting by Exemplar Selection in Task-oriented Dialogue SystemChen Chen 0075, Ruizhe Li 0001, Yuchen Hu, Yuanyuan Chen, Chengwei Qin, Qiang Zhang. 48-61 [doi]

Unveiling Imitation Learning: Exploring the impact of Data Falsity to Large Language ModelHyunsoo Cho. 62-73 [doi]

The Counterfeit Conundrum: Can Code Language Models Grasp the Nuances of Their Incorrect Generations?Alex Gu, Wen-Ding Li, Naman Jain, Theo Olausson, Celine Lee, Koushik Sen, Armando Solar-Lezama. 74-117 [doi]

CHIME: LLM-Assisted Hierarchical Organization of Scientific Studies for Literature Review SupportChao-Chun Hsu, Erin Bransom, Jenna Sparks, Bailey Kuehl, Chenhao Tan, David Wadden, Lucy Lu Wang, Aakanksha Naik. 118-132 [doi]

Which Side Are You On? A Multi-task Dataset for End-to-End Argument Summarisation and EvaluationHao Li 0074, Yuping Wu, Viktor Schlegel, Riza Batista-Navarro, Tharindu Madusanka, Iqra Zahid, Jiayan Zeng, Xiaochi Wang, Xinran He, Yizhi Li, Goran Nenadic. 133-150 [doi]

A Grounded Preference Model for LLM AlignmentTahira Naseem, Guangxuan Xu, Sarathkrishna Swaminathan, Asaf Yehudai, Subhajit Chaudhury, Radu Florian, Ramón Fernandez Astudillo, Asim Munawar. 151-162 [doi]

Graph Chain-of-Thought: Augmenting Large Language Models by Reasoning on GraphsBowen Jin, Chulin Xie, Jiawei Zhang 0001, Kashob Kumar Roy, Yu Zhang 0044, Zheng Li 0018, Ruirui Li 0002, Xianfeng Tang, Suhang Wang, Yu Meng 0001, Jiawei Han 0001. 163-184 [doi]

Text2DB: Integration-Aware Information Extraction with Large Language Model AgentsYizhu Jiao, Sha Li, Sizhe Zhou, Heng Ji, Jiawei Han 0001. 185-205 [doi]

How Important is a Language Model for Low-resource ASR?Zoey Liu, Nitin Venkateswaran, Éric Le Ferrand, Emily Prud'hommeaux. 206-213 [doi]

MediSwift: Efficient Sparse Pre-trained Biomedical Language ModelsVithursan Thangarasa, Mahmoud Salem, Shreyas Saxena, Chen-Yu Leong, Joel Hestness, Sean Lie. 214-230 [doi]

Lexicon-Level Contrastive Visual-Grounding Improves Language ModelingChengxu Zhuang, Evelina Fedorenko, Jacob Andreas. 231-247 [doi]

P-TA: Using Proximal Policy Optimization to Enhance Tabular Data Augmentation via Large Language ModelsShuo Yang, Chenchen Yuan, Yao Rong, Felix Steinbauer, Gjergji Kasneci. 248-264 [doi]

Teaching-Assistant-in-the-Loop: Improving Knowledge Distillation from Imperfect Teacher Models in Low-Budget ScenariosYuhang Zhou, Wei Ai 0002. 265-282 [doi]

Small Models are Valuable Plug-ins for Large Language ModelsCanwen Xu, Yichong Xu, Shuohang Wang, Yang Liu 0124, Chenguang Zhu 0001, Julian J. McAuley. 283-294 [doi]

Are self-explanations from Large Language Models faithful?Andreas Madsen, Sarath Chandar, Siva Reddy. 295-337 [doi]

ImplicitAVE: An Open-Source Dataset and Multimodal LLMs Benchmark for Implicit Attribute Value ExtractionHenry Peng Zou, Vinay Samuel, Yue Zhou, Weizhi Zhang 0001, Liancheng Fang, Zihe Song, Philip S. Yu, Cornelia Caragea. 338-354 [doi]

Prompt Engineering a Prompt EngineerQinyuan Ye, Mohamed Ahmed, Reid Pryzant, Fereshte Khani. 355-385 [doi]

ASPIRE: Language-Guided Data Augmentation for Improving Robustness Against Spurious CorrelationsSreyan Ghosh, Chandra Kiran Reddy Evuru, Sonal Kumar, Utkarsh Tyagi, S. Sakshi, Sanjoy Chowdhury, Dinesh Manocha. 386-406 [doi]

Tables as Texts or Images: Evaluating the Table Reasoning Ability of LLMs and MLLMsNaihao Deng, Zhenjie Sun, Ruiqi He, Aman Sikka, Yulong Chen 0001, Lin Ma, Yue Zhang 0004, Rada Mihalcea. 407-426 [doi]

Biasly: An Expert-Annotated Dataset for Subtle Misogyny Detection and MitigationBrooklyn Sheppard, Anna Richter, Allison Cohen, Elizabeth Allyn Smith, Tamara Kneese, Carolyne Pelletier, Ioana Baldini, Yue Dong. 427-452 [doi]

BlendSQL: A Scalable Dialect for Unifying Hybrid Question Answering in Relational AlgebraParker Glenn, Parag Dakle, Liang Wang, Preethi Raghavan. 453-466 [doi]

LLM-QAT: Data-Free Quantization Aware Training for Large Language ModelsZechun Liu, Barlas Oguz, Changsheng Zhao 0002, Ernie Chang, Pierre Stock, Yashar Mehdad, Yangyang Shi, Raghuraman Krishnamoorthi, Vikas Chandra. 467-484 [doi]

InfiMM: Advancing Multimodal Understanding with an Open-Sourced Visual Language ModelHaogeng Liu, Quanzeng You, Yiqi Wang, Xiaotian Han, Bohan Zhai, Yongfei Liu, Wentao Chen, Yiren Jian, Yunzhe Tao, Jianbo Yuan, Ran He 0001, Hongxia Yang. 485-492 [doi]

Towards Verifiable Generation: A Benchmark for Knowledge-aware Language Model AttributionXinze Li, Yixin Cao 0002, Liangming Pan, Yubo Ma, Aixin Sun. 493-516 [doi]

Benchmarking Cognitive Biases in Large Language Models as EvaluatorsRyan Koo, Minhwa Lee, Vipul Raheja, Jong Inn Park, Zae Myung Kim, Dongyeop Kang. 517-545 [doi]

X-Instruction: Aligning Language Model in Low-resource Languages with Self-curated Cross-lingual InstructionsChong Li, Wen Yang, Jiajun Zhang, Jinliang Lu, Shaonan Wang, Chengqing Zong. 546-566 [doi]

Muffin: Mitigating Unhelpfulness in Emotional Support Conversations with Multifaceted AI FeedbackJiashuo Wang, Chunpu Xu, Chak Tou Leong, Wenjie Li, Jing Li. 567-585 [doi]

Resonance RoPE: Improving Context Length Generalization of Large Language ModelsSuyuchen Wang, Ivan Kobyzev, Peng Lu, Mehdi Rezagholizadeh, Bang Liu. 586-598 [doi]

MedAgents: Large Language Models as Collaborators for Zero-shot Medical ReasoningXiangru Tang, Anni Zou, Zhuosheng Zhang 0001, Ziming Li, Yilun Zhao 0001, Xingyao Zhang, Arman Cohan, Mark Gerstein. 599-621 [doi]

Meta-Reasoning: Semantics-Symbol Deconstruction for Large Language ModelsYiming Wang, Zhuosheng Zhang 0001, Pei Zhang 0011, Baosong Yang, Rui Wang 0015. 622-643 [doi]

DPDLLM: A Black-box Framework for Detecting Pre-training Data from Large Language ModelsBaohang Zhou, Zezhong Wang 0004, Lingzhi Wang, Hongru Wang 0003, Ying Zhang 0015, Kehui Song, Xuhui Sui, Kam-Fai Wong. 644-653 [doi]

PACIT: Unlocking the Power of Examples for Better In-Context Instruction TuningTianci Xue, Ziqi Wang, Yixia Li, Yun Chen 0007, Guanhua Chen 0001. 654-665 [doi]

Listen Again and Choose the Right Answer: A New Paradigm for Automatic Speech Recognition with Large Language ModelsYuchen Hu, Chen Chen 0075, Chengwei Qin, Qiushi Zhu, Engsiong Chng, Ruizhe Li 0001. 666-679 [doi]

Towards Better Graph-based Cross-document Relation Extraction via Non-bridge Entity Enhancement and Prediction DebiasingHao Yue, Shaopeng Lai, Chengyi Yang, Liang Zhang, Junfeng Yao, Jinsong Su. 680-691 [doi]

Large Language Models can Share Images, Too!Young-Jun Lee, Dokyong Lee, Joo Won Sung, Jonghwan Hyeon, Ho-Jin Choi. 692-713 [doi]

CodeM: Less Data Yields More Versatility via Ability MatrixDaoguang Zan, Ailun Yu, Wei Liu 0007, Bo Shen, Shaoxin Lin, Yongshun Gong, Yafen Yao, Yan Liu, Bei Guan, Weihua Luo, Yongji Wang 0002, Qianxiang Wang, LiZhen Cui. 714-729 [doi]

Do LVLMs Understand Charts? Analyzing and Correcting Factual Errors in Chart CaptioningKung-Hsiang Huang, Mingyang Zhou, Hou Pong Chan, Yi Fung 0001, Zhenhailong Wang, Lingyu Zhang, Shih-Fu Chang, Heng Ji. 730-749 [doi]

BIDER: Bridging Knowledge Inconsistency for Efficient Retrieval-Augmented LLMs via Key Supporting EvidenceJiajie Jin, Yutao Zhu 0001, Yujia Zhou 0002, Zhicheng Dou. 750-761 [doi]

Beyond Literal Descriptions: Understanding and Locating Open-World Objects Aligned with Human IntentionsWenxuan Wang, Yisi Zhang, Xingjian He, Yichen Yan, Zijia Zhao, Xinlong Wang, Jing Liu. 762-776 [doi]

Incremental Sequence Labeling: A Tale of Two ShiftsShengjie Qiu, Junhao Zheng, Zhen Liu, Yicheng Luo, Qianli Ma 0001. 777-791 [doi]

How Proficient Are Large Language Models in Formal Languages? An In-Depth Insight for Knowledge Base Question AnsweringJinxin Liu, Shulin Cao, Jiaxin Shi, Tingjian Zhang, Lunyiu Nie, Linmei Hu, Lei Hou 0001, Juanzi Li. 792-815 [doi]

MELOV: Multimodal Entity Linking with Optimized Visual Features in Latent SpaceXuhui Sui, Ying Zhang, Yu Zhao, Kehui Song, Baohang Zhou, Xiaojie Yuan. 816-826 [doi]

Unsupervised Distractor Generation via Large Language Model Distilling and Counterfactual Contrastive DecodingFanyi Qu, Hao Sun, Yunfang Wu. 827-838 [doi]

Conversational Question Answering with Language Models Generated Reformulations over Knowledge GraphLihui Liu, Blaine Hill, Boxin Du, Fei Wang 0001, Hanghang Tong. 839-850 [doi]

Debug like a Human: A Large Language Model Debugger via Verifying Runtime Execution Step by StepLi Zhong, Zilong Wang 0002, Jingbo Shang. 851-870 [doi]

Effective In-Context Example Selection through Data CompressionZhongxiang Sun, Kepu Zhang, Haoyu Wang, Xiao Zhang, Jun Xu. 871-877 [doi]

Are U a Joke Master? Pun Generation via Multi-Stage Curriculum Learning towards a Humor LLMYang Chen, Chong Yang, Tu Hu, Xinhao Chen, Man Lan, Li Cai, Xinlin Zhuang, Xuan Lin, Xin Lu, Aimin Zhou. 878-890 [doi]

Knowledgeable Preference Alignment for LLMs in Domain-specific Question AnsweringYichi Zhang, Zhuo Chen 0007, Yin Fang, Yanxi Lu, Fangming Li, Wen Zhang 0015, Huajun Chen. 891-904 [doi]

MARIO: MAth Reasoning with code Interpreter Output - A Reproducible PipelineMinpeng Liao, Chengxi Li 0014, Wei Luo, Jing Wu, Kai Fan 0002. 905-924 [doi]

DiffusPoll: Conditional Text Diffusion Model for Poll GenerationLe Cheng, Shuangyin Li. 925-935 [doi]

Exploring Mathematical Extrapolation of Large Language Models with Synthetic DataHaolong Li, Yu Ma, Yinqi Zhang, Chen Ye, Jie Chen. 936-946 [doi]

Implanting LLM's Knowledge via Reading Comprehension Tree for Toxicity DetectionHankun Kang, Tieyun Qian. 947-962 [doi]

LLMLingua-2: Data Distillation for Efficient and Faithful Task-Agnostic Prompt CompressionZhuoshi Pan, Qianhui Wu, Huiqiang Jiang, Menglin Xia, Xufang Luo, Jue Zhang, Qingwei Lin, Victor Rühle, Yuqing Yang 0001, Chin-Yew Lin, H. Vicky Zhao, Lili Qiu, Dongmei Zhang 0001. 963-981 [doi]

EconNLI: Evaluating Large Language Models on Economics ReasoningYue Guo, Yi Yang. 982-994 [doi]

Better Late Than Never: Model-Agnostic Hallucination Post-Processing Framework Towards Clinical Text SummarizationSongda Li, Yunqi Zhang, Chunyuan Deng, Yake Niu, Hui Zhao. 995-1011 [doi]

Finding and Editing Multi-Modal Neurons in Pre-Trained TransformersHaowen Pan, Yixin Cao 0002, Xiaozhi Wang, Xun Yang, Meng Wang 0001. 1012-1037 [doi]

Realistic Evaluation of Toxicity in Large Language ModelsTinh Luong, Thanh-Thien Le, Linh Ngo, Thien Nguyen. 1038-1047 [doi]

Controllable Text Generation with Residual Memory TransformerHanqing Zhang, Si Sun, Haiming Wu, Dawei Song 0001. 1048-1066 [doi]

Prompt-Based Length Controlled Generation with Multiple Control TypesRenlong Jie, Xiaojun Meng, Lifeng Shang, Xin Jiang 0002, Qun Liu 0001. 1067-1085 [doi]

PCA-Bench: Evaluating Multimodal Large Language Models in Perception-Cognition-Action ChainLiang Chen 0024, Yichi Zhang, Shuhuai Ren, Haozhe Zhao, Zefan Cai, YuChi Wang, Peiyi Wang, Xiangdi Meng, Tianyu Liu 0001, Baobao Chang. 1086-1104 [doi]

Pearl: A Review-driven Persona-Knowledge Grounded Conversational Recommendation DatasetMinjin Kim, Minju Kim, Hana Kim, Beong-woo Kwak, SeongKu Kang, Youngjae Yu, Jinyoung Yeo, Dongha Lee. 1105-1120 [doi]

CoLLaVO: Crayon Large Language and Vision mOdelByung kwan Lee, Beomchan Park, Chae Won Kim, Yong Man Ro. 1121-1138 [doi]

Modelling Variability in Human Annotator SimulationWen Wu, Wenlin Chen, Chao Zhang 0031, Philip C. Woodland. 1139-1157 [doi]

BEnQA: A Question Answering Benchmark for Bengali and EnglishSheikh Shafayat, H. M. Quamran Hasan, Minhajur Rahman Chowdhury Mahim, Rifki Afina Putri, James Thorne, Alice Oh. 1158-1177 [doi]

MORE: Multi-mOdal REtrieval Augmented Generative Commonsense ReasoningWanqing Cui, Keping Bi, Jiafeng Guo, Xueqi Cheng. 1178-1192 [doi]

Cutting Off the Head Ends the Conflict: A Mechanism for Interpreting and Mitigating Knowledge Conflicts in Language ModelsZhuoran Jin, Pengfei Cao, Hongbang Yuan, Yubo Chen 0001, Jiexin Xu, Huaijun Li, Xiaojian Jiang, Kang Liu 0001, Jun Zhao 0001. 1193-1215 [doi]

BioT5+: Towards Generalized Biological Understanding with IUPAC Integration and Multi-task TuningQizhi Pei, Lijun Wu, Kaiyuan Gao, Xiaozhuan Liang, Yin Fang, Jinhua Zhu 0001, Shufang Xie 0003, Tao Qin 0001, Rui Yan 0001. 1216-1240 [doi]

SIBO: A Simple Booster for Parameter-Efficient Fine-TuningZhihao Wen, Jie Zhang, Yuan Fang. 1241-1257 [doi]

GeoEval: Benchmark for Evaluating LLMs and Multi-Modal Models on Geometry Problem-SolvingJiaxin Zhang 0024, Zhongzhi Li, Ming-Liang Zhang 0005, Fei Yin, Cheng-Lin Liu 0001, Yashar Moshfeghi. 1258-1276 [doi]

Boosting Textural NER with Synthetic Image and Instructive AlignmentJiahao Wang, Wenjun Ke, Peng Wang, Hang Zhang, Dong Nie, Jiajun Liu, Guozheng Li, Ziyu Shang. 1277-1287 [doi]

Neurons in Large Language Models: Dead, N-gram, PositionalElena Voita, Javier Ferrando, Christoforos Nalmpantis. 1288-1301 [doi]

LLMs as Bridges: Reformulating Grounded Multimodal Named Entity RecognitionJinyuan Li, Han Li, Di Sun, Jiahao Wang, Wenkun Zhang, Zan Wang, Gang Pan 0002. 1302-1318 [doi]

Learning Job Title Representation from Job Description Aggregation NetworkNapat Laosaengpha, Thanit Tativannarat, Chawan Piansaddhayanon, Attapol Rutherford, Ekapol Chuangsuwanich. 1319-1329 [doi]

FlowVQA: Mapping Multimodal Logic in Visual Question Answering with FlowchartsShubhankar Singh, Purvi Chaurasia, Yerram Varun, Pranshu Pandya, Vatsal Gupta, Vivek Gupta 0001, Dan Roth. 1330-1350 [doi]

Flexible Weight Tuning and Weight Fusion Strategies for Continual Named Entity RecognitionYahan Yu, Duzhen Zhang, Xiuyi Chen, Chenhui Chu. 1351-1358 [doi]

Unveiling the Achilles' Heel of NLG Evaluators: A Unified Adversarial Framework Driven by Large Language ModelsYiming Chen, Chen Zhang, Danqing Luo, Luis Fernando D'Haro, Robby T. Tan, Haizhou Li 0001. 1359-1375 [doi]

Teacher-Student Training for Debiasing: General Permutation Debiasing for Large Language ModelsAdian Liusie, Yassir Fathullah, Mark J. F. Gales. 1376-1387 [doi]

Uncovering Limitations of Large Language Models in Information Seeking from TablesChaoxu Pang, Yixuan Cao 0001, Chunhao Yang, Ping Luo 0001. 1388-1409 [doi]

An Ensemble-of-Experts Framework for Rehearsal-free Continual Relation ExtractionShen Zhou, Yongqi Li 0002, Xin Miao, Tieyun Qian. 1410-1423 [doi]

Temporal Validity Change PredictionGeorg Wenzel, Adam Jatowt. 1424-1446 [doi]

RIFF: Learning to Rephrase Inputs for Few-shot Fine-tuning of Language ModelsSaeed Najafi, Alona Fyshe. 1447-1466 [doi]

Modelling Commonsense Commonalities with Multi-Facet Concept EmbeddingsHanane Kteich, Na Li, Usashi Chatterjee, Zied Bouraoui, Steven Schockaert. 1467-1480 [doi]

Revisiting Multimodal Transformers for Tabular Data with Text FieldsThomas Bonnier. 1481-1500 [doi]

An Empirical Study on the Characteristics of Bias upon Context Length Variation for BanglaJayanta Sadhu, Ayan Antik Khan, Abhik Bhattacharjee, Rifat Shahriyar. 1501-1520 [doi]

ConTempo: A Unified Temporally Contrastive Framework for Temporal Relation ExtractionJingcheng Niu, Saifei Liao, Victoria Ng, Simon de Montigny, Gerald Penn. 1521-1533 [doi]

CHARP: Conversation History AwaReness Probing for Knowledge-grounded Dialogue SystemsAbbas Ghaddar, David Alfonso-Hermelo, Philippe Langlais, Mehdi Rezagholizadeh, Boxing Chen, Prasanna Parthasarathi. 1534-1551 [doi]

CriticBench: Benchmarking LLMs for Critique-Correct ReasoningZicheng Lin, Zhibin Gou, Tian Liang, Ruilin Luo, Haowei Liu, Yujiu Yang. 1552-1587 [doi]

DAFNet: Dynamic Auxiliary Fusion for Sequential Model Editing in Large Language ModelsTaolin Zhang, Qizhou Chen, Dongyang Li, Chengyu Wang 0001, Xiaofeng He, Longtao Huang, Hui Xue', Jun Huang 0007. 1588-1602 [doi]

Controllable Text Summarization: Unraveling Challenges, Approaches, and Prospects - A SurveyAshok Urlana, Pruthwik Mishra, Tathagato Roy, Rahul Mishra. 1603-1623 [doi]

Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel SystemHengguan Huang, Songtao Wang, Hongfu Liu 0002, Hao Wang 0014, Ye Wang 0007. 1624-1637 [doi]

Everything of Thoughts: Defying the Law of Penrose Triangle for Thought GenerationRuomeng Ding, Chaoyun Zhang, Lu Wang 0008, Yong Xu 0010, Minghua Ma, Wei Zhang 0056, Si-qin, Saravan Rajmohan, Qingwei Lin, Dongmei Zhang 0001. 1638-1662 [doi]

SPAGHETTI: Open-Domain Question Answering from Heterogeneous Data Sources with Retrieval and Semantic ParsingHeidi C. Zhang, Sina J. Semnani, Farhad Ghassemi, Jialiang Xu, Shicheng Liu, Monica S. Lam. 1663-1678 [doi]

Data Augmentation using LLMs: Data Perspectives, Learning Paradigms and ChallengesBosheng Ding, Chengwei Qin, Ruochen Zhao, Tianze Luo, Xinze Li, Guizhen Chen, Wenhan Xia, Junjie Hu 0001, Anh Tuan Luu, Shafiq Joty. 1679-1705 [doi]

k-SemStamp: A Clustering-Based Semantic Watermark for Detection of Machine-Generated TextAbe Bohan Hou, Jingyu Zhang, Yichen Wang, Daniel Khashabi, Tianxing He. 1706-1715 [doi]

ColorSwap: A Color and Word Order Dataset for Multimodal EvaluationJirayu Burapacheep, Ishan Gaur, Agam Bhatia, Tristan Thrush. 1716-1726 [doi]

Revisiting OPRO: The Limitations of Small-Scale LLMs as OptimizersTuo Zhang, Jinyue Yuan, Salman Avestimehr. 1727-1735 [doi]

CeeBERT: Cross-Domain Inference in Early Exit BERTDivya Jyoti Bajpai, Manjesh K. Hanawal. 1736-1748 [doi]

UNIWIZ: A Unified Large Language Model Orchestrated Wizard for Safe Knowledge Grounded ConversationsSouvik Das, Rohini K. Srihari. 1749-1762 [doi]

A Shocking Amount of the Web is Machine Translated: Insights from Multi-Way ParallelismBrian Thompson 0001, Mehak Preet Dhaliwal, Peter Frisch, Tobias Domhan, Marcello Federico. 1763-1775 [doi]

RankMean: Module-Level Importance Score for Merging Fine-tuned LLM ModelsGabriel Perin, Xuxi Chen, Shusen Liu 0001, Bhavya Kailkhura, Zhangyang Wang, Brian Gallagher. 1776-1782 [doi]

VALOR-EVAL: Holistic Coverage and Faithfulness Evaluation of Large Vision-Language ModelsHaoyi Qiu, Wenbo Hu 0006, Zi-Yi Dou, Nanyun Peng. 1783-1805 [doi]

Cyclical Contrastive Learning Based on Geodesic for Zero-shot Cross-lingual Spoken Language UnderstandingXuxin Cheng, Zhihong Zhu, Bang Yang, Xianwei Zhuang, Hongxiang Li, Yuexian Zou. 1806-1816 [doi]

Towards Safer Large Language Models through Machine UnlearningZheyuan Liu 0010, Guangyao Dou, Zhaoxuan Tan, Yijun Tian 0001, Meng Jiang 0001. 1817-1829 [doi]

The Impact of Reasoning Step Length on Large Language ModelsMingyu Jin, Qinkai Yu, Dong Shu, Haiyan Zhao, Wenyue Hua, Yanda Meng, Yongfeng Zhang, Mengnan Du. 1830-1842 [doi]

Towards Understanding Task-agnostic Debiasing Through the Lenses of Intrinsic Bias and ForgetfulnessGuangliang Liu, Milad Afshari, Xitong Zhang, Zhiyu Xue, Avrajit Ghosh, Bidhan Bashyal, Rongrong Wang, Kristen Johnson. 1843-1856 [doi]

SKGSum: Structured Knowledge-Guided Document SummarizationQiqi Wang 0005, Ruofan Wang, Kaiqi Zhao 0001, Robert Amor, Benjamin Liu, Jiamou Liu, Xianda Zheng, Zijian Huang 0003. 1857-1871 [doi]

Chinese Spoken Named Entity Recognition in Real-world Scenarios: Dataset and ApproachesShilin Zhou, Zhenghua Li, Chen Gong 0004, Lei Zhang, Yu Hong, Min Zhang 0005. 1872-1884 [doi]

DEBATE: Devil's Advocate-Based Assessment and Text EvaluationAlex Kim, Keonwoo Kim, Sangwon Yoon. 1885-1897 [doi]

Can Large Multimodal Models Uncover Deep Semantics Behind Images?Yixin Yang, Zheng Li, Qingxiu Dong, Heming Xia, Zhifang Sui. 1898-1912 [doi]

Harvesting Events from Multiple Sources: Towards a Cross-Document Event Extraction ParadigmQiang Gao, Zixiang Meng, Bobo Li, Jun Zhou, Fei Li 0021, Chong Teng, Donghong Ji. 1913-1927 [doi]

A Graph per Persona: Reasoning about Subjective Natural Language DescriptionsEunJeong Hwang, Vered Shwartz, Dan Gutfreund, Veronika Thost. 1928-1942 [doi]

MolTC: Towards Molecular Relational Modeling In Language ModelsJunfeng Fang, Shuai Zhang, Chang Wu, Zhengyi Yang 0007, Zhiyuan Liu 0001, Sihang Li, Kun Wang, Wenjie Du, Xiang Wang 0010. 1943-1958 [doi]

KPEval: Towards Fine-Grained Semantic-Based Keyphrase EvaluationDi Wu, Da Yin, Kai-Wei Chang. 1959-1981 [doi]

Learning Low-dimensional Multi-domain Knowledge Graph Embedding via Dual Archimedean SpiralsJiang Li, Xiangdong Su, Fujun Zhang, Guanglai Gao. 1982-1994 [doi]

LoRA Meets Dropout under a Unified FrameworkSheng Wang, Liheng Chen, Jiyue Jiang, Boyang Xue, Lingpeng Kong, Chuan Wu. 1995-2008 [doi]

Enhancing Text-to-SQL Parsing through Question Rewriting and Execution-Guided RefinementWenxin Mao, Ruiqi Wang, Jiyu Guo, Jichuan Zeng, Cuiyun Gao, Peiyi Han, Chuanyi Liu. 2009-2024 [doi]

The Knowledge Alignment Problem: Bridging Human and External Knowledge for Large Language ModelsShuo Zhang, Liangming Pan, Junzhou Zhao, William Yang Wang. 2025-2038 [doi]

ChatKBQA: A Generate-then-Retrieve Framework for Knowledge Base Question Answering with Fine-tuned Large Language ModelsHaoran Luo, Haihong E, Zichen Tang, Shiyao Peng, Yikai Guo, Wentai Zhang 0004, Chenghao Ma, Guanting Dong, Meina Song, Wei Lin, Yifan Zhu, Anh Tuan Luu. 2039-2056 [doi]

Achilles-Bench: A Challenging Benchmark for Low-Resource EvaluationYudong Wang, Chang Ma, Qingxiu Dong, Zhifang Sui, Lingpeng Kong, Jingjing Xu. 2057-2080 [doi]

INTERVENOR: Prompting the Coding Ability of Large Language Models with the Interactive Chain of RepairHanbin Wang, Zhenghao Liu, Shuo Wang, Ganqu Cui, Ning Ding 0002, Zhiyuan Liu 0001, Ge Yu 0001. 2081-2107 [doi]

SocialBench: Sociality Evaluation of Role-Playing Conversational AgentsHongzhan Chen, Hehong Chen, Ming Yan, Wenshen Xu, Gao Xing, Weizhou Shen, Xiaojun Quan, Chenliang Li, Ji Zhang 0011, Fei Huang 0004. 2108-2126 [doi]

From Model-centered to Human-Centered: Revision Distance as a Metric for Text Evaluation in LLMs-based ApplicationsYongqiang Ma, Lizhi Qing, Jiawei Liu, Yangyang Kang, Yue Zhang, Wei Lu, Xiaozhong Liu, Qikai Cheng. 2127-2137 [doi]

Context-Aware Tracking and Dynamic Introduction for Incomplete Utterance Rewriting in Extended Multi-Turn DialoguesXinnan Guo, Qian Zhu, Qiuhui Shi, Xuan Lin, Liubin Wang, DaqianLi DaqianLi, Yongrui Chen 0002. 2138-2148 [doi]

EmotionQueen: A Benchmark for Evaluating Empathy of Large Language ModelsYuyan Chen, Songzhou Yan, Sijia Liu, Yueze Li, Yanghua Xiao. 2149-2176 [doi]

Plum: Prompt Learning using MetaheuristicsRui Pan, Shuo Xing, Shizhe Diao, Wenhe Sun, Xiang Liu, Kashun Shum, Jipeng Zhang, Renjie Pi, Tong Zhang. 2177-2197 [doi]

HOTVCOM: Generating Buzzworthy Comments for VideosYuyan Chen, Songzhou Yan, Qingpei Guo, Jiyuan Jia, Zhixu Li, Yanghua Xiao. 2198-2224 [doi]

Do Large Language Models have Problem-Solving Capability under Incomplete Information Scenarios?Yuyan Chen, Yueze Li, Songzhou Yan, Sijia Liu, Jiaqing Liang, Yanghua Xiao. 2225-2238 [doi]

Distilling Robustness into Natural Language Inference Models with Domain-Targeted AugmentationJoe Stacey, Marek Rei. 2239-2258 [doi]

Into the Unknown: Generating Geospatial Descriptions for New EnvironmentsTzuf Paz-Argaman, John Palowitch, Sayali Kulkarni, Reut Tsarfaty, Jason Baldridge. 2259-2273 [doi]

Unpacking Tokenization: Evaluating Text Compression and its Correlation with Model PerformanceOmer Goldman, Avi Caciularu, Matan Eyal, Kris Cao, Idan Szpektor, Reut Tsarfaty. 2274-2286 [doi]

Length-aware Byte Pair Encoding for Mitigating Over-segmentation in Korean Machine TranslationJungseob Lee, Hyeonseok Moon, Seungjun Lee, Chanjun Park, Sugyeong Eo, Hyunwoong Ko, Jaehyung Seo, Seungyoon Lee, HeuiSeok Lim. 2287-2303 [doi]

Multilingual Instruction Tuning With Just a Pinch of MultilingualityUri Shaham 0002, Jonathan Herzig, Roee Aharoni, Idan Szpektor, Reut Tsarfaty, Matan Eyal. 2304-2317 [doi]

M3-Embedding: Multi-Linguality, Multi-Functionality, Multi-Granularity Text Embeddings Through Self-Knowledge DistillationJianlyu Chen, Shitao Xiao, Peitian Zhang, Kun Luo, Defu Lian, Zheng Liu 0011. 2318-2335 [doi]

Iterative Refinement of Project-Level Code Context for Precise Code Generation with Compiler FeedbackZhangqian Bi, Yao Wan 0001, Zheng Wang, Hongyu Zhang 0002, Batu Guan, Fangxin Lu, Zili Zhang, Yulei Sui, Hai Jin 0001, Xuanhua Shi. 2336-2353 [doi]

An Element is Worth a Thousand Words: Enhancing Legal Case Retrieval by Incorporating Legal ElementsChenlong Deng, Zhicheng Dou, Yujia Zhou 0002, Peitian Zhang, Kelong Mao. 2354-2365 [doi]

SoMeLVLM: A Large Vision Language Model for Social Media ProcessingXinnong Zhang, Haoyu Kuang, Xinyi Mou, Hanjia Lyu, Kun Wu, Siming Chen 0001, Jiebo Luo, Xuanjing Huang 0001, Zhongyu Wei. 2366-2389 [doi]

KoCommonGEN v2: A Benchmark for Navigating Korean Commonsense Reasoning Challenges in Large Language ModelsJaehyung Seo, Jaewook Lee, Chanjun Park, Seongtae Hong, Seungjun Lee, HeuiSeok Lim. 2390-2415 [doi]

NeuroPrune: A Neuro-inspired Topological Sparse Training Algorithm for Large Language ModelsAmit Dhurandhar, Tejaswini Pedapati, Ronny Luss, Soham Dan, Aurélie C. Lozano, Payel Das, Georgios Kollias. 2416-2430 [doi]

Ranking Large Language Models without Ground TruthAmit Dhurandhar, Rahul Nair, Moninder Singh, Elizabeth Daly, Karthikeyan Natesan Ramamurthy. 2431-2452 [doi]

Integrating Physician Diagnostic Logic into Large Language Models: Preference Learning from Process FeedbackChengfeng Dou, Ying Zhang, Zhi Jin, Wenpin Jiao, Haiyan Zhao, Yongqiang Zhao, Zhengwei Tao. 2453-2473 [doi]

LM-Cocktail: Resilient Tuning of Language Models via Model MergingShitao Xiao, Zheng Liu, Peitian Zhang, Xingrun Xing. 2474-2488 [doi]

Episodic Memory Retrieval from LLMs: A Neuromorphic Mechanism to Generate Commonsense Counterfactuals for Relation ExtractionXin Miao, Yongqi Li 0002, Shen Zhou, Tieyun Qian. 2489-2511 [doi]

SemRel2024: A Collection of Semantic Textual Relatedness Datasets for 13 LanguagesNedjma Ousidhoum, Shamsuddeen Hassan Muhammad, Mohamed Abdalla, Idris Abdulmumin, Ibrahim Said Ahmad, Sanchit Ahuja, Alham Fikri Aji, Vladimir Araujo, Abinew Ali Ayele, Pavan Baswani, Meriem Beloucif, Chris Biemann, Sofia Bourhim, Christine de Kock, Genet Shanko Dekebo, Oumaima Hourrane, Gopichand Kanumolu, Lokesh Madasu, Samuel Rutunda, Manish Shrivastava 0001, Thamar Solorio, Nirmal Surange, Hailegnaw Getaneh Tilaye, Krishnapriya Vishnubhotla, Genta Muhie Winata, Seid Yimam, Saif M. Mohammad. 2512-2530 [doi]

Alirector: Alignment-Enhanced Chinese Grammatical Error CorrectorHaihui Yang, Xiaojun Quan. 2531-2546 [doi]

VISPool: Enhancing Transformer Encoders with Vector Visibility Graph Neural NetworksTuna Alikasifoglu, Arda C. Aras, Aykut Koç. 2547-2556 [doi]

The Emotion Dynamics of Literary NovelsKrishnapriya Vishnubhotla, Adam Hammond, Graeme Hirst, Saif Mohammad. 2557-2574 [doi]

Accurate and Nuanced Open-QA Evaluation Through Textual EntailmentPeiran Yao, Denilson Barbosa 0001. 2575-2587 [doi]

Dictionary-Aided Translation for Handling Multi-Word Expressions in Low-Resource LanguagesAntonios Dimakis, Stella Markantonatou, Antonios Anastasopoulos. 2588-2595 [doi]

LANS: A Layout-Aware Neural Solver for Plane Geometry ProblemZhongzhi Li, Ming-Liang Zhang 0005, Fei Yin, Cheng-Lin Liu 0001. 2596-2608 [doi]

Knowledge Crosswords: Geometric Knowledge Reasoning with Large Language ModelsWenxuan Ding 0001, Shangbin Feng, Yuhan Liu, Zhaoxuan Tan, Vidhisha Balachandran, Tianxing He, Yulia Tsvetkov. 2609-2636 [doi]

DELL: Generating Reactions and Explanations for LLM-Based Misinformation DetectionHerun Wan, Shangbin Feng, Zhaoxuan Tan, Heng Wang 0008, Yulia Tsvetkov, Minnan Luo. 2637-2667 [doi]

The Language Barrier: Dissecting Safety Challenges of LLMs in Multilingual ContextsLingfeng Shen, Weiting Tan, Sihao Chen, Yunmo Chen, Jingyu Zhang, Haoran Xu, Boyuan Zheng, Philipp Koehn, Daniel Khashabi. 2668-2680 [doi]

Self-Specialization: Uncovering Latent Expertise within Large Language ModelsJunmo Kang, Hongyin Luo, Yada Zhu, Jacob A. Hansen, James R. Glass, David D. Cox, Alan Ritter, Rogério Feris, Leonid Karlinsky. 2681-2706 [doi]

FUSE: Measure-Theoretic Compact Fuzzy Set Representation for Taxonomy ExpansionFred Xu, Song Jiang 0002, Zijie Huang 0002, Xiao Luo 0001, Shichang Zhang, Yuanzhou Chen, Yizhou Sun. 2707-2720 [doi]

Chain of Logic: Rule-Based Reasoning with Large Language ModelsSergio Servantez, Joe Barrow, Kristian J. Hammond, Rajiv Jain. 2721-2733 [doi]

Merging Facts, Crafting Fallacies: Evaluating the Contradictory Nature of Aggregated Factual Claims in Long-Form GenerationsCheng-Han Chiang, Hung-yi Lee. 2734-2751 [doi]

Can You Learn Semantics Through Next-Word Prediction? The Case of EntailmentWilliam Merrill, Zhaofeng Wu, Norihito Naka, Yoon Kim, Tal Linzen. 2752-2773 [doi]

Simulated Misinformation Susceptibility (SMISTS): Enhancing Misinformation Research with Large Language Model SimulationsWeicheng Ma, Chunyuan Deng, Aram Moossavi, Lili Wang, Soroush Vosoughi, Diyi Yang. 2774-2788 [doi]

Social Intelligence Data Infrastructure: Structuring the Present and Navigating the FutureMinzhi Li, Weiyan Shi, Caleb Ziems, Diyi Yang. 2789-2805 [doi]

Selective Prefix Tuning for Pre-trained Language ModelsHongyi Zhang, Zuchao Li, Ping Wang, Hai Zhao 0001. 2806-2813 [doi]

MODABS: Multi-Objective Learning for Dynamic Aspect-Based SummarizationXiaobo Guo, Soroush Vosoughi. 2814-2827 [doi]

Non-compositional Expression Generation and its Continual LearningJianing Zhou, Suma Bhat. 2828-2839 [doi]

Medical Dialogue System: A Survey of Categories, Methods, Evaluation and ChallengesXiaoming Shi, Zeming Liu, Li Du, Yuxuan Wang 0001, Hongru Wang 0003, Yuhang Guo 0001, Tong Ruan, Jie Xu, Xiaofan Zhang 0002, Shaoting Zhang 0001. 2840-2861 [doi]

Direct Evaluation of Chain-of-Thought in Multi-hop Reasoning with Knowledge GraphsThi Nguyen, Linhao Luo, Fatemeh Shiri, Dinh Phung 0001, Yuan-Fang Li, Thuy-Trang Vu, Gholamreza Haffari. 2862-2883 [doi]

Comprehensive Abstractive Comment Summarization with Dynamic Clustering and Chain of ThoughtLongyin Zhang, Bowei Zou, Jacintha Yi, AiTi Aw. 2884-2896 [doi]

Self-Supervised Position Debiasing for Large Language ModelsZHongkun Liu, Zheng Chen, Mengqi Zhang, Zhaochun Ren, Pengjie Ren, Zhumin Chen. 2897-2917 [doi]

HyperCL: A Contrastive Learning Framework for Hyper-Relational Knowledge Graph Embedding with Hierarchical OntologyYuhuan Lu, Weijian Yu, Xin Jing, Dingqi Yang. 2918-2929 [doi]

Encoding Hierarchical Schema via Concept Flow for Multifaceted Ideology DetectionSongtao Liu, Bang Wang, Wei Xiang 0005, Han Xu 0003, Minghua Xu 0001. 2930-2942 [doi]

Character-Level Chinese Dependency Parsing via Modeling Latent Intra-Word StructureYang Hou, Zhenghua Li. 2943-2956 [doi]

AlignRE: An Encoding and Semantic Alignment Approach for Zero-Shot Relation ExtractionZehan Li, Fu Zhang, Jingwei Cheng. 2957-2966 [doi]

Disperse-Then-Merge: Pushing the Limits of Instruction Tuning via Alignment Tax ReductionTingchen Fu, Deng Cai 0002, Lemao Liu, Shuming Shi 0001, Rui Yan 0001. 2967-2985 [doi]

Efficient Knowledge Infusion via KG-LLM AlignmentZhouyu Jiang, Ling Zhong, Mengshu Sun, Jun Xu, Rui Sun, Hui Cai, Shuhan Luo, Zhiqiang Zhang. 2986-2999 [doi]

Towards Precise Localization of Critical Errors in Machine TranslationDahyun Jung, Sugyeong Eo, HeuiSeok Lim. 3000-3012 [doi]

LoRAPrune: Structured Pruning Meets Low-Rank Parameter-Efficient Fine-TuningMingyang Zhang 0007, Hao Chen 0041, Chunhua Shen, Zhen Yang 0009, Linlin Ou, Xinyi Yu, Bohan Zhuang. 3013-3026 [doi]

Speculative Decoding via Early-exiting for Faster LLM Inference with Thompson Sampling Control MechanismJiahao Liu, Qifan Wang, Jingang Wang, Xunliang Cai. 3027-3043 [doi]

Towards Better Utilization of Multi-Reference Training Data for Chinese Grammatical Error CorrectionYumeng Liu, Zhenghua Li, Haochen Jiang, Bo Zhang 0071, Chen Li 0001, Ji Zhang 0011. 3044-3052 [doi]

AgentTuning: Enabling Generalized Agent Abilities for LLMsAohan Zeng, Mingdao Liu, Rui Lu, Bowen Wang, Xiao Liu 0036, Yuxiao Dong, Jie Tang 0001. 3053-3077 [doi]

Transition-based Opinion Generation for Aspect-based Sentiment AnalysisTianlai Ma, Zhongqing Wang, Guodong Zhou. 3078-3087 [doi]

Modeling Dynamic Topics in Chain-Free Fashion by Evolution-Tracking Contrastive Learning and Unassociated Word ExclusionXiaobao Wu, Xinshuai Dong, Liangming Pan, Thong Nguyen, Anh Tuan Luu. 3088-3105 [doi]

A Chinese Dataset for Evaluating the Safeguards in Large Language ModelsYuxia Wang, Zenan Zhai, Haonan Li 0002, Xudong Han, Shom Lin, Zhenxuan Zhang, Angela Zhao, Preslav Nakov, Timothy Baldwin. 3106-3119 [doi]

LLMFactor: Extracting Profitable Factors through Prompts for Explainable Stock Movement PredictionMeiyun Wang, Kiyoshi Izumi, Hiroki Sakaji. 3120-3131 [doi]

You Only Look at Screens: Multimodal Chain-of-Action AgentsZhuosheng Zhang 0001, Aston Zhang. 3132-3149 [doi]

SP³: Enhancing Structured Pruning via PCA ProjectionYuxuan Hu, Jing Zhang 0001, Zhe Zhao, Chen Zhao, Xiaodong Chen, Cuiping Li 0001, Hong Chen 0001. 3150-3170 [doi]

GENDEX: Generative Data Augmentation Strategy Leveraging External Data for Abstractive Dialogue SummarizationSangwon Park, Hongseok Choi, Dongha Choi, Hyunju Lee. 3171-3185 [doi]

Concept-Best-Matching: Evaluating Compositionality In Emergent CommunicationBoaz Carmeli, Yonatan Belinkov, Ron Meir. 3186-3194 [doi]

A Tale of Two Revisions: Summarizing Changes Across Document VersionsT. Y. S. S. Santosh, Natwar Modani, Apoorv Saxena. 3195-3211 [doi]

Refine, Align, and Aggregate: Multi-view Linguistic Features Enhancement for Aspect Sentiment Triplet ExtractionGuixin Su, Mingmin Wu, Zhongqiang Huang, Yongcheng Zhang, Tongguan Wang, Yuxue Hu, Ying Sha. 3212-3228 [doi]

Pro-Woman, Anti-Man? Identifying Gender Bias in Stance DetectionYingjie Li, Yue Zhang 0004. 3229-3236 [doi]

Likelihood-based Mitigation of Evaluation Bias in Large Language ModelsMasanari Ohi, Masahiro Kaneko, Ryuto Koike, Mengsay Loem, Naoaki Okazaki. 3237-3245 [doi]

The Music Maestro or The Musically Challenged, A Massive Music Evaluation Benchmark for Large Language ModelsJiajia Li, Lu Yang, Mingni Tang, Chenchong Chenchong, Zuchao Li, Ping Wang, Hai Zhao 0001. 3246-3257 [doi]

PyramidInfer: Pyramid KV Cache Compression for High-throughput LLM InferenceDongjie Yang, Xiaodong Han, Yan Gao, Yao Hu, Shilin Zhang, Hai Zhao 0001. 3258-3270 [doi]

From Role-Play to Drama-Interaction: An LLM SolutionWeiqi Wu, Hongqiu Wu, Lai Jiang, Xingyuan Liu, Hai Zhao 0001, Min Zhang 0005. 3271-3290 [doi]

TimeChara: Evaluating Point-in-Time Character Hallucination of Role-Playing Large Language ModelsJaewoo Ahn, Taehyun Lee, Junyoung Lim, Jin-Hwa Kim, Sangdoo Yun, Hwaran Lee, Gunhee Kim. 3291-3325 [doi]

Red Teaming Visual Language ModelsMukai Li, Lei Li 0039, Yuwei Yin, Masood Ahmed, Zhenguang Liu, Qi Liu 0049. 3326-3342 [doi]

Enhancing Semantic Consistency of Large Language Models through Model Editing: An Interpretability-Oriented ApproachJingyuan Yang 0008, Dapeng Chen, Yajing Sun, Rongjun Li, Zhiyong Feng, Wei Peng. 3343-3353 [doi]

Semantic Skill Grounding for Embodied Instruction-Following in Cross-Domain EnvironmentsSangwoo Shin, Seunghyun Kim, Youngsoo Jang, Moontae Lee, Honguk Woo. 3354-3376 [doi]

LIRE: listwise reward enhancement for preference alignmentMingye Zhu, Yi Liu, Lei Zhang 0119, Junbo Guo, Zhendong Mao. 3377-3394 [doi]

See It All: Contextualized Late Aggregation for 3D Dense CaptioningMinjung Kim 0001, Hyung Lim, Seung Hwan Kim, Soonyoung Lee, Bumsoo Kim, Gunhee Kim. 3395-3405 [doi]

DARA: Decomposition-Alignment-Reasoning Autonomous Language Agent for Question Answering over Knowledge GraphsHaishuo Fang, Xiaodan Zhu, Iryna Gurevych. 3406-3432 [doi]

GKT: A Novel Guidance-Based Knowledge Transfer Framework For Efficient Cloud-edge Collaboration LLM DeploymentYao Yao, Zuchao Li, Hai Zhao 0001. 3433-3446 [doi]

Compositional Generalization with Grounded Language ModelsSondre Wold, Étienne Simon, Lucas Georges Gabriel Charpentier, Egor V. Kostylev, Erik Velldal, Lilja Øvrelid. 3447-3460 [doi]

Rethinking Negative Instances for Generative Named Entity RecognitionYuyang Ding, Juntao Li, Pinzheng Wang, Zecheng Tang, Yan Bowen, Min Zhang. 3461-3475 [doi]

WilKE: Wise-Layer Knowledge Editor for Lifelong Knowledge EditingChenhui Hu, Pengfei Cao, Yubo Chen 0001, Kang Liu 0001, Jun Zhao 0001. 3476-3503 [doi]

DINER: Debiasing Aspect-based Sentiment Analysis with Multi-variable Causal InferenceJialong Wu 0007, Linhai Zhang, Deyu Zhou, Guoqiang Xu. 3504-3518 [doi]

STAR: Constraint LoRA with Dynamic Active Learning for Data-Efficient Fine-Tuning of Large Language ModelsLinhai Zhang, Jialong Wu 0007, Deyu Zhou, Guoqiang Xu. 3519-3532 [doi]

How Much Does Nonverbal Communication Conform to Entropy Rate Constancy?: A Case Study on Listener Gaze in InteractionYu Wang, Yang Xu, Gabriel Skantze, Hendrik Buschmeier. 3533-3545 [doi]

Lost in the Source Language: How Large Language Models Evaluate the Quality of Machine TranslationXu Huang, Zhirui Zhang, Xiang Geng, Yichao Du, Jiajun Chen, Shujian Huang. 3546-3562 [doi]

Chain-of-Verification Reduces Hallucination in Large Language ModelsShehzaad Dhuliawala, Mojtaba Komeili, Jing Xu, Roberta Raileanu, Xian Li, Asli Celikyilmaz, Jason Weston. 3563-3578 [doi]

Measuring Bargaining Abilities of LLMs: A Benchmark and A Buyer-Enhancement MethodTian Xia, Zhiwei He 0002, Tong Ren, Yibo Miao, Zhuosheng Zhang 0001, Yang Yang 0030, Rui Wang 0015. 3579-3602 [doi]

DevEval: A Manually-Annotated Code Generation Benchmark Aligned with Real-World Code RepositoriesJia Li, Ge Li 0001, Yunfei Zhao, Yongmin Li, Huanyu Liu, Hao Zhu, Lecheng Wang, Kaibo Liu, Zheng Fang, Lanshen Wang, Jiazheng Ding, Xuanming Zhang, Yuqi Zhu, Yihong Dong, Zhi Jin, Binhua Li, Fei Huang, Yongbin Li, Bin Gu, Mengfei Yang. 3603-3614 [doi]

LPNL: Scalable Link Prediction with Large Language ModelsBaolong Bi, Shenghua Liu, Yiwei Wang, Lingrui Mei, Xueqi Cheng. 3615-3625 [doi]

Aligning Speech Segments Beyond Pure SemanticsKevin Heffernan, Artyom Kozhevnikov, Loïc Barrault, Alexandre Mourachko, Holger Schwenk. 3626-3635 [doi]

Video-Language Understanding: A Survey from Model Architecture, Model Training, and Data PerspectivesThong Nguyen, Yi Bin, Junbin Xiao, Leigang Qu, Yicong Li 0004, Jay Zhangjie Wu, Cong-Duy Nguyen, See-Kiong Ng, Anh Tuan Luu. 3636-3657 [doi]

Generative Input: Towards Next-Generation Input Methods ParadigmKeyu Ding, Yongcan Wang, Zihang Xu, Zhenzhen Jia, Enhong Chen. 3658-3669 [doi]

A + B: A General Generator-Reader Framework for Optimizing LLMs to Unleash Synergy PotentialWei Tang 0015, Yixin Cao 0006, Jiahao Ying, Bo Wang, Yuyue Zhao, Yong Liao, Peng Zhou. 3670-3685 [doi]

Functional Overlap Reranking for Neural Code GenerationHung To, Minh Nguyen, Nghi Bui. 3686-3704 [doi]

Adversarial Preference Optimization: Enhancing Your Alignment via RM-LLM GamePengyu Cheng, Yifan Yang, Jian Li, Yong Dai, Tianhao Hu, Peixin Cao, Nan Du, Xiaolong Li. 3705-3716 [doi]

Pinpointing Diffusion Grid Noise to Enhance Aspect Sentiment Quad PredictionLinan Zhu, Xiangfan Chen, Xiaolei Guo, Chenwei Zhang, Zhechao Zhu, Zehai Zhou, Xiangjie Kong 0001. 3717-3726 [doi]

Continual Contrastive Spoken Language UnderstandingUmberto Cappellazzo, Enrico Fini, Muqiao Yang, Daniele Falavigna, Alessio Brutti, Bhiksha Raj. 3727-3741 [doi]

LLM as Prompter: Low-resource Inductive Reasoning on Arbitrary Knowledge GraphsKai Wang, Yuwei Xu, Zhiyong Wu, Siqiang Luo. 3742-3759 [doi]

Unsupervised Parsing by Searching for Frequent Word Sequences among Sentences with Equivalent Predicate-Argument StructuresJunjie Chen, Xiangheng He, Danushka Bollegala, Yusuke Miyao. 3760-3772 [doi]

Data-Centric Explainable Debiasing for Improving Fairness in Pre-trained Language ModelsYingji Li, Mengnan Du, Rui Song 0008, Xin Wang, Ying Wang. 3773-3786 [doi]

Knowledge-Driven Cross-Document Relation ExtractionMonika Jain, Raghava Mutharaju, Kuldeep Singh, Ramakanth Kavuluru. 3787-3797 [doi]

Injecting Salesperson's Dialogue Strategies in Large Language Models with Chain-of-Thought ReasoningWen Chang, Yun-Nung Chen. 3798-3812 [doi]

KG-Adapter: Enabling Knowledge Graph Integration in Large Language Models through Parameter-Efficient Fine-TuningShiyu Tian, Yangyang Luo, Tianze Xu, Caixia Yuan, Huixing Jiang, Chen Wei, Xiaojie Wang 0006. 3813-3828 [doi]

Just Ask One More Time! Self-Agreement Improves Reasoning of Language Models in (Almost) All ScenariosLei Lin, Jia-Yi Fu, Pengli Liu, Qingyang Li, Yan Gong, Junchen Wan, Fuzheng Zhang, Zhongyuan Wang 0006, Di Zhang, Kun Gai. 3829-3852 [doi]

Evaluating LLMs' Mathematical Reasoning in Financial Document Question AnsweringPragya Srivastava, Manuj Malik, Vivek Gupta 0001, Tanuja Ganu, Dan Roth. 3853-3878 [doi]

Improving In-Context Learning with Prediction Feedback for Sentiment AnalysisHongling Xu, Qianlong Wang, Yice Zhang, Min Yang 0007, Xi Zeng, Bing Qin 0001, Ruifeng Xu. 3879-3890 [doi]

Can Large Language Models Mine Interpretable Financial Factors More Effectively? A Neural-Symbolic Factor Mining Agent ModelZhiwei Li 0006, Ran Song, Caihong Sun, Wei Xu 0008, Zhengtao Yu 0001, Ji-Rong Wen. 3891-3902 [doi]

Discerning and Resolving Knowledge Conflicts through Adaptive Decoding with Contextual Information-Entropy ConstraintXiaowei Yuan, Zhao Yang, Yequan Wang, Shengping Liu, Jun Zhao, Kang Liu. 3903-3922 [doi]

SALAD-Bench: A Hierarchical and Comprehensive Safety Benchmark for Large Language ModelsLijun Li, Bowen Dong, Ruohui Wang, Xuhao Hu, Wangmeng Zuo, Dahua Lin, Yu Qiao 0001, Jing Shao. 3923-3954 [doi]

Extracting and Encoding: Leveraging Large Language Models and Medical Knowledge to Enhance Radiological Text RepresentationPablo Messina, René Vidal, Denis Parra, Alvaro Soto, Vladimir Araujo. 3955-3986 [doi]

GNNavi: Navigating the Information Flow in Large Language Models by Graph Neural NetworkShuzhou Yuan, Ercong Nie, Michael Färber 0001, Helmut Schmid, Hinrich Schütze. 3987-4001 [doi]

M-QALM: A Benchmark to Assess Clinical Reading Comprehension and Knowledge Recall in Large Language Models via Question AnsweringAnand Subramanian 0004, Viktor Schlegel, Abhinav Ramesh Kashyap, Thanh Tung Nguyen, Vijay Prakash Dwivedi, Stefan Winkler 0001. 4002-4042 [doi]

MovieSum: An Abstractive Summarization Dataset for Movie ScreenplaysRohit Saxena, Frank Keller. 4043-4050 [doi]

Autonomous Workflow for Multimodal Fine-Grained Training Assistants Towards Mixed RealityJiahuan Pei, Irene Viola 0001, Haochen Huang, Junxiao Wang, Moonisa Ahsan, Fanghua Ye 0001, Jiang Yiming, Yao Sai, Di Wang, Zhumin Chen, Pengjie Ren, Pablo César. 4051-4066 [doi]

Perceptions of Language Technology Failures from South Asian English SpeakersFaye Holt, William Held, Diyi Yang. 4067-4081 [doi]

A Mechanistic Analysis of a Transformer Trained on a Symbolic Multi-Step Reasoning TaskJannik Brinkmann, Abhay Sheshadri, Victor Levoso, Paul Swoboda, Christian Bartelt. 4082-4102 [doi]

Optimal Transport Guided Correlation Assignment for Multimodal Entity LinkingZefeng Zhang, Jiawei Sheng, Chuang Zhang, Liangyunzhi Liangyunzhi, Wenyuan Zhang 0002, Siqi Wang, Tingwen Liu. 4103-4117 [doi]

On Efficiently Representing Regular Languages as RNNsAnej Svete, Robin Chan, Ryan Cotterell. 4118-4135 [doi]

A Survey on Modelling Morality for Text AnalysisInes Reinig, Maria Becker, Ines Rehbein, Simone Paolo Ponzetto. 4136-4155 [doi]

Your Vision-Language Model Itself Is a Strong Filter: Towards High-Quality Instruction Tuning with Data SelectionRuibo Chen, Yihan Wu, Lichang Chen, Guodong Liu, Qi He, Tianyi Xiong, Chenxi Liu, Junfeng Guo, Heng Huang. 4156-4172 [doi]

DebugBench: Evaluating Debugging Capability of Large Language ModelsRunchu Tian, Yining Ye, Yujia Qin, Xin Cong, Yankai Lin, Yinxu Pan, Yesai Wu, Haotian Hui, Weichuan Liu, Zhiyuan Liu 0001, Maosong Sun 0001. 4173-4198 [doi]

POP-CEE: Position-oriented Prompt-tuning Model for Causal Emotion EntailmentZhihan Zhou 0003, Xue Gu, Yujie Zhao, Hao Xu 0012. 4199-4210 [doi]

Context Length Extension via Generalized Extrapolation ScaleLinhan Li, Huaping Zhang. 4211-4218 [doi]

Selectively Answering Visual QuestionsJulian Eisenschlos, Hernán Maina, Guido Ivetta, Luciana Benotti. 4219-4229 [doi]

Wav2SQL: Direct Generalizable Speech-To-SQL ParsingHuadai Liu, Rongjie Huang, Jinzheng He, Gang Sun, Ran Shen, Xize Cheng, Zhou Zhao. 4230-4242 [doi]

E2-LLM: Efficient and Extreme Length Extension of Large Language ModelsJiaheng Liu, ZhiqiBai ZhiqiBai, Yuanxing Zhang, Chenchen Zhang, YuangZh YuangZh, Ge Zhang, JiakaiWang JiakaiWang, Haoran Que, Yukang Chen, Wenbo Su, Tiezheng Ge, Jie Fu, Wenhu Chen, Bo Zheng 0007. 4243-4253 [doi]

Are Female Carpenters like Blue Bananas? A Corpus Investigation of Occupation Gender TypicalityDa Ju, Karen Ullrich, Adina Williams. 4254-4274 [doi]

Call Me When Necessary: LLMs can Efficiently and Faithfully Reason over Structured EnvironmentsSitao Cheng, Ziyuan Zhuang, Yong Xu 0010, Fangkai Yang, Chaoyun Zhang, Xiaoting Qin, Xiang Huang, Ling Chen, Qingwei Lin, Dongmei Zhang 0001, Saravan Rajmohan, Qi Zhang. 4275-4295 [doi]

Legal Judgment Reimagined: PredEx and the Rise of Intelligent AI Interpretation in Indian CourtsShubham Kumar Nigam, Anurag Sharma, Danush Khanna, Noel Shallum, Kripabandhu Ghosh, Arnab Bhattacharya 0001. 4296-4315 [doi]

RulE: Knowledge Graph Reasoning with Rule EmbeddingXiaojuan Tang, Song Chun Zhu, Yitao Liang, Muhan Zhang. 4316-4335 [doi]

Multi-Objective Linguistic Control of Large Language ModelsDang Nguyen, Jiuhai Chen, Tianyi Zhou 0001. 4336-4347 [doi]

Evaluating the Smooth Control of Attribute Intensity in Text Generation with LLMsShang Zhou, Feng Yao, Chengyu Dong, Zihan Wang 0001, Jingbo Shang. 4348-4362 [doi]

Planning, Creation, Usage: Benchmarking LLMs for Comprehensive Tool Utilization in Real-World Complex ScenariosShijue Huang, Wanjun Zhong, Jianqiao Lu, Qi Zhu 0007, Jiahui Gao, Weiwen Liu, Yutai Hou, Xingshan Zeng, Yasheng Wang, Lifeng Shang, Xin Jiang 0002, Ruifeng Xu, Qun Liu 0001. 4363-4400 [doi]

Do Androids Know They're Only Dreaming of Electric Sheep?Sky CH-Wang, Benjamin Van Durme, Jason Eisner, Chris Kedzie. 4401-4420 [doi]

URG: A Unified Ranking and Generation Method for Ensembling Language ModelsBo Lv, Chen Tang, Yanan Zhang, Xin Liu, Ping Luo, Yue Yu. 4421-4434 [doi]

Multi-Modal Retrieval For Large Language Model Based Speech RecognitionAditya Gourav, Jari Kolehmainen, Prashanth Gurunath Shivakumar, Yile Gu, Grant P. Strimel, Ankur Gandhe, Ariya Rastrow, Ivan Bulyko. 4435-4446 [doi]

LoraRetriever: Input-Aware LoRA Retrieval and Composition for Mixed Tasks in the WildZiyu Zhao, Leilei Gan, Guoyin Wang 0002, Wangchunshu Zhou, Hongxia Yang, Kun Kuang, Fei Wu 0001. 4447-4462 [doi]

ELAD: Explanation-Guided Large Language Models Active DistillationYifei Zhang 0006, Bo Pan, Chen Ling 0003, Yuntong Hu, Liang Zhao 0002. 4463-4475 [doi]

Evaluating the Elementary Multilingual Capabilities of Large Language Models with MultiQCarolin Holtermann, Paul Röttger, Timm Dill, Anne Lauscher. 4476-4494 [doi]

Semantics or spelling? Probing contextual word embeddings with orthographic noiseJacob Matthews, John Starr, Marten Van Schijndel. 4495-4504 [doi]

The Good and The Bad: Exploring Privacy Issues in Retrieval-Augmented Generation (RAG)Shenglai Zeng, Jiankun Zhang, Pengfei He, Yiding Liu, Yue Xing, Han Xu 0002, Jie Ren 0019, Yi Chang 0001, Shuaiqiang Wang, Dawei Yin, Jiliang Tang. 4505-4524 [doi]

EmpathicStories++: A Multimodal Dataset for Empathy Towards Personal ExperiencesJocelyn Shen, Yubin Kim, Mohit Hulse, Wazeer Zulfikar, Sharifa Alghowinem, Cynthia Breazeal, Hae Park. 4525-4536 [doi]

MRL Parsing Without Tears: The Case of HebrewShaltiel Shmidman, Avi Shmidman, Moshe Koppel, Reut Tsarfaty. 4537-4550 [doi]

SyntaxShap: Syntax-aware Explainability Method for Text GenerationKenza Amara, Rita Sevastjanova, Mennatallah El-Assady. 4551-4566 [doi]

Automated Detection and Analysis of Data Practices Using A Real-World CorpusMukund Srinath, Pranav Narayanan Venkit, Maria Badillo, Florian Schaub, C. Lee Giles, Shomir Wilson. 4567-4574 [doi]

Enhancing Hyperbolic Knowledge Graph Embeddings via Lorentz TransformationsXiran Fan, Minghua Xu 0003, Huiyuan Chen, Yuzhong Chen, Mahashweta Das, Hao Yang 0007. 4575-4589 [doi]

Tell Me What's Next: Textual Foresight for Generic UI RepresentationsAndrea Burns, Kate Saenko, Bryan A. Plummer. 4590-4611 [doi]

Probing the Uniquely Identifiable Linguistic Patterns of Conversational AI AgentsIqra Zahid, Tharindu Madusanka, Riza Batista-Navarro, Youcheng Sun. 4612-4628 [doi]

The Butterfly Effect of Altering Prompts: How Small Changes and Jailbreaks Affect Large Language Model PerformanceAbel Salinas, Fred Morstatter. 4629-4651 [doi]

X-Shot: A Unified System to Handle Frequent, Few-shot and Zero-shot Learning Simultaneously in ClassificationHanzi Xu, Muhao Chen, Lifu Huang, Slobodan Vucetic, Wenpeng Yin 0001. 4652-4665 [doi]

SPIN: Sparsifying and Integrating Internal Neurons in Large Language Models for Text ClassificationDifan Jiao, Yilun Liu 0002, Zhenwei Tang, Daniel Matter, Jürgen Pfeffer, Ashton Anderson. 4666-4682 [doi]

Decomposing Co-occurrence Matrices into Interpretable Components as Formal ConceptsAkihiro Maeda, Takuma Torii, Shohei Hidaka. 4683-4700 [doi]

Two-Pronged Human Evaluation of ChatGPT Self-Correction in Radiology Report SimplificationZiyu Yang, Santhosh Cherian, Slobodan Vucetic. 4701-4714 [doi]

Planning First, Question Second: An LLM-Guided Method for Controllable Question GenerationKunze Li, Yu Zhang. 4715-4729 [doi]

RA-ISF: Learning to Answer and Understand from Retrieval Augmentation via Iterative Self-FeedbackYanming Liu, Xinyue Peng, Xuhong Zhang 0002, Weihao Liu, Jianwei Yin, Jiannan Cao, Tianyu Du. 4730-4749 [doi]

MrRank: Improving Question Answering Retrieval System through Multi-Result Ranking ModelDanupat Khamnuansin, Tawunrat Chalothorn, Ekapol Chuangsuwanich. 4750-4762 [doi]

Chain-of-Question: A Progressive Question Decomposition Approach for Complex Knowledge Base Question AnsweringYixing Peng, Quan Wang 0002, Licheng Zhang, Yi Liu, Zhendong Mao. 4763-4776 [doi]

Instruction Tuning with Retrieval-based Examples Ranking for Aspect-based Sentiment AnalysisGuangmin Zheng, Jin Wang, Liang-Chih Yu, Xuejie Zhang. 4777-4788 [doi]

Unveiling the Truth and Facilitating Change: Towards Agent-based Large-scale Social Movement SimulationXinyi Mou, Zhongyu Wei, Xuanjing Huang. 4789-4809 [doi]

Incorporating Syntax and Lexical Knowledge to Multilingual Sentiment Classification on Large Language ModelsHiroshi Kanayama, Yang Zhao, Ran Iwamoto, Takuya Ohko. 4810-4817 [doi]

Locating and Extracting Relational Concepts in Large Language ModelsZijian Wang, Britney White, Chang Xu. 4818-4832 [doi]

Unraveling and Mitigating Retriever Inconsistencies in Retrieval-Augmented Large Language ModelsMingda Li, Xinyu Li, Yifan Chen, Wenfeng Xuan, Weinan Zhang 0003. 4833-4850 [doi]

SenticVec: Toward Robust and Human-Centric Neurosymbolic Sentiment AnalysisXulang Zhang, Rui Mao 0010, Erik Cambria. 4851-4863 [doi]

Towards Tracing Trustworthiness Dynamics: Revisiting Pre-training Period of Large Language ModelsChen Qian 0006, Jie Zhang, Wei Yao, Dongrui Liu, Zhenfei Yin, Yu Qiao 0001, Yong Liu 0007, Jing Shao. 4864-4888 [doi]

Language Models can Evaluate Themselves via Probability DiscrepancyTingyu Xia, Bowen Yu 0002, Yuan Wu, Yi Chang, Chang Zhou. 4889-4901 [doi]

Evaluating the Validity of Word-level Adversarial Attacks with Large Language ModelsHuichi Zhou, Zhaoyang Wang, Hongtao Wang 0002, Dongping Chen, Wenhan Mu, Fangyuan Zhang. 4902-4922 [doi]

On the Language Encoder of Contrastive Cross-modal ModelsMengjie Zhao, Junya Ono, Zhi Zhong, Chieh-Hsin Lai, Yuhta Takida, Naoki Murata, Wei-Hsiang Liao, Takashi Shibuya 0001, Hiromi Wakaki, Yuki Mitsufuji. 4923-4940 [doi]

Your Co-Workers Matter: Evaluating Collaborative Capabilities of Language Models in Blocks WorldGuande Wu, Chen Zhao, Cláudio T. Silva, He He 0001. 4941-4957 [doi]

Anchor-based Large Language ModelsJianhui Pang, Fanghua Ye 0001, Derek F. Wong, Xin He, Wanshun Chen, Longyue Wang. 4958-4976 [doi]

MLeVLM: Improve Multi-level Progressive Capabilities based on Multimodal Large Language Model for Medical Visual Question AnsweringDexuan Xu, Yanyuan Chen, Jieyi Wang, Yue Huang, Hanpin Wang, Zhi Jin, Hongxing Wang, Weihua Yue, Jing He, Hang Li, Yu Huang. 4977-4997 [doi]

Disentangling Length from Quality in Direct Preference OptimizationRyan Park, Rafael Rafailov, Stefano Ermon, Chelsea Finn. 4998-5017 [doi]

MIKE: A New Benchmark for Fine-grained Multimodal Entity Knowledge EditingJiaqi Li, Miaozeng Du, Chuanyi Zhang, Yongrui Chen 0002, Nan Hu, Guilin Qi, Haiyun Jiang, Siyuan Cheng 0008, Bozhong Tian. 5018-5029 [doi]

Reformulating Domain Adaptation of Large Language Models as Adapt-Retrieve-Revise: A Case Study on Chinese Legal DomainZhen Wan, Yating Zhang, Yexiang Wang, Fei Cheng, Sadao Kurohashi. 5030-5041 [doi]

MemeMQA: Multimodal Question Answering for Memes via Rationale-Based InferencingSiddhant Agarwal, Shivam Sharma, Preslav Nakov, Tanmoy Chakraborty 0002. 5042-5078 [doi]

Improving Attributed Text Generation of Large Language Models via Preference LearningDongfang Li, Zetian Sun, Baotian Hu, Zhenyu Liu, Xinshuo Hu, Xuebo Liu 0002, Min Zhang 0005. 5079-5101 [doi]

KOMBO: Korean Character Representations Based on the Combination Rules of SubcharactersSungho Kim, Juhyeong Park, Yeachan Kim, SangKeun Lee 0001. 5102-5119 [doi]

Tree-Planted Transformers: Unidirectional Transformer Language Models with Implicit Syntactic SupervisionRyo Yoshida, Taiga Someya, Yohei Oseki. 5120-5134 [doi]

Play Guessing Game with LLM: Indirect Jailbreak Attack with Implicit CluesZhiyuan Chang, Mingyang Li, Yi Liu, Junjie Wang, Qing Wang, Yang Liu. 5135-5147 [doi]

Publicly Shareable Clinical Large Language Model Built on Synthetic Clinical NotesSunjun Kweon, Junu Kim, Jiyoun Kim, Sujeong Im, Eunbyeol Cho, Seongsu Bae, Jungwoo Oh, Gyubok Lee, Jong Hak Moon, Seng Chan You, Seungjin Baek, Chang Hoon Han, Yoon Bin Jung, Yohan Jo, Edward Choi. 5148-5168 [doi]

Extending Context Window of Large Language Models via Semantic CompressionWeizhi Fei, Xueyan Niu, Pingyi Zhou, Lu Hou, Bo Bai 0001, Lei Deng, Wei Han 0004. 5169-5181 [doi]

Plausible Extractive Rationalization through Semi-Supervised Entailment SignalWei Jie Yeo, Ranjan Satapathy, Erik Cambria. 5182-5192 [doi]

Translation Deserves Better: Analyzing Translation Artifacts in Cross-lingual Visual Question AnsweringChaeHun Park, Koanho Lee, Hyesu Lim, Jaeseok Kim, JunMo Park, Yu-Jung Heo, Du-Seong Chang, Jaegul Choo. 5193-5221 [doi]

Scented-EAE: Stage-Customized Entity Type Embedding for Event Argument ExtractionYu Yang, Jinyu Guo, Kai Shuang, Chenrui Mao. 5222-5235 [doi]

Fast Randomized Low-Rank Adaptation of Pre-trained Language Models with PAC RegularizationZijian Lei, Dong Qian, William Cheung. 5236-5249 [doi]

SDA: Semantic Discrepancy Alignment for Text-conditioned Image RetrievalYuchen Yang, Yu Wang 0027, Yanfeng Wang. 5250-5261 [doi]

Se²: Sequential Example Selection for In-Context LearningHaoyu Liu, Jianfeng Liu, Shaohan Huang, Yuefeng Zhan, Hao Sun 0015, Weiwei Deng, Furu Wei, Qi Zhang 0066. 5262-5284 [doi]

Generation Meets Verification: Accelerating Large Language Model Inference with Smart Parallel Auto-Correct DecodingHanling Yi, Feng Lin 0009, Hongbin Li, Peiyang Ning, Xiaotian Yu, Rong Xiao. 5285-5299 [doi]

StructEval: Deepen and Broaden Large Language Model Assessment via Structured EvaluationBoxi Cao, Mengjie Ren, Hongyu Lin, Xianpei Han, Feng Zhang, Junfeng Zhan, Le Sun 0001. 5300-5318 [doi]

Mitigating Privacy Seesaw in Large Language Models: Augmented Privacy Neuron Editing via Activation PatchingXinwei Wu, Weilong Dong, Shaoyang Xu, Deyi Xiong. 5319-5332 [doi]

Which Information Matters? Dissecting Human-written Multi-document Summaries with Partial Information DecompositionLaura Mascarell, Yan L'Homme, Majed El Helou. 5333-5338 [doi]

BadActs: A Universal Backdoor Defense in the Activation SpaceBiao Yi, Sishuo Chen, Yiming Li, Tong Li 0011, Baolei Zhang, Zheli Liu. 5339-5352 [doi]

ReactXT: Understanding Molecular "Reaction-ship" via Reaction-Contextualized Molecule-Text PretrainingZhiyuan Liu, Yaorui Shi, An Zhang, Sihang Li, Enzhi Zhang, Xiang Wang, Kenji Kawaguchi, Tat-Seng Chua. 5353-5377 [doi]

Multi-modal Concept Alignment Pre-training for Generative Medical Visual Question AnsweringQuan Yan, Junwen Duan, Jianxin Wang 0001. 5378-5389 [doi]

Exploring Ordinality in Text Classification: A Comparative Study of Explicit and Implicit TechniquesSiva Rajesh Kasa, Aniket Goel, Karan Gupta, Sumegh Roychowdhury, Pattisapu Priyatam, Anish Bhanushali, Prasanna Srinivasa Murthy. 5390-5404 [doi]

Evaluating Large Language Models on Wikipedia-Style Survey GenerationFan Gao, Hang Jiang, Rui Yang, Qingcheng Zeng, Jinghui Lu, Moritz Blum, Tianwei She, Yuang Jiang, Irene Li. 5405-5418 [doi]

The Butterfly Effect of Model Editing: Few Edits Can Trigger Large Language Models CollapseWanli Yang, Fei Sun 0001, Xinyu Ma, Xun Liu, Dawei Yin, Xueqi Cheng. 5419-5437 [doi]

Can We Continually Edit Language Models? On the Knowledge Attenuation in Sequential Model EditingQi Li, Xiaowen Chu. 5438-5455 [doi]

Before Generation, Align it! A Novel and Effective Strategy for Mitigating Hallucinations in Text-to-SQL GenerationGe Qu, Jinyang Li, Bowen Li, Bowen Qin, Nan Huo, Chenhao Ma 0001, Reynold Cheng. 5456-5471 [doi]

Translatotron-V(ison): An End-to-End Model for In-Image Machine TranslationZhibin Lan, Liqiang Niu, Fandong Meng, Jie Zhou 0016, Min Zhang 0005, Jinsong Su. 5472-5485 [doi]

StatBot.Swiss: Bilingual Open Data Exploration in Natural LanguageFarhad Nooralahzadeh, Yi Zhang, Ellery Smith, Sabine Maennel, Cyril Matthey-Doret, Raphaël de Fondeville, Kurt Stockinger. 5486-5507 [doi]

Subtle Signatures, Strong Shields: Advancing Robust and Imperceptible Watermarking in Large Language ModelsYubing Ren, Ping Guo, Yanan Cao, Wei Ma. 5508-5519 [doi]

Thinking about how to extract: Energizing LLMs' emergence capabilities for document-level event argument extractionKai Shuang, Zhouji Zhouji, Qiwei Wang, Jinyu Guo. 5520-5532 [doi]

Improving the Robustness of Distantly-Supervised Named Entity Recognition via Uncertainty-Aware Teacher Learning and Student-Student Collaborative LearningShuzheng Si, Helan Hu, Haozhe Zhao, Shuang Zeng, Kaikai An, Zefan Cai, Baobao Chang. 5533-5546 [doi]

Predicting Narratives of Climate Obstruction in Social Media AdvertisingHarri Rowlands, Gaku Morio, Dylan Tanner, Christopher D. Manning. 5547-5558 [doi]

SSS: Editing Factual Knowledge in Language Models towards Semantic Sparse SpaceHuazheng Wang, Haifeng Sun 0001, Jingyu Wang 0001, Qi Qi 0001, Zixuan Xia, Menghao Zhang, Jianxin Liao. 5559-5570 [doi]

GeoHard: Towards Measuring Class-wise Hardness through Modelling Class SemanticsFengyu Cai, Xinran Zhao, Hongming Zhang 0009, Iryna Gurevych, Heinz Koeppl. 5571-5597 [doi]

Unveiling Selection Biases: Exploring Order and Token Sensitivity in Large Language ModelsSheng-Lun Wei, Cheng-Kuang Wu, Hen-Hsen Huang, Hsin-Hsi Chen. 5598-5621 [doi]

ArabicMMLU: Assessing Massive Multitask Language Understanding in ArabicFajri Koto, Haonan Li 0002, Sara Shatnawi, Jad Doughman, Abdelrahman Boda Sadallah, Aisha Alraeesi, Khalid Almubarak, Zaid Alyafeai, Neha Sengupta, Shady Shehata, Nizar Habash, Preslav Nakov, Timothy Baldwin. 5622-5640 [doi]

On the Relationship Between RNN Hidden-State Vectors and Semantic StructuresEdi Muskardin, Martin Tappler, Ingo Pill, Bernhard K. Aichernig, Thomas Pock. 5641-5658 [doi]

XMC-Agent : Dynamic Navigation over Scalable Hierarchical Index for Incremental Extreme Multi-label ClassificationYanjiang Liu, Tianyun Zhong, Yaojie Lu 0001, Hongyu Lin, Ben He, Shuheng Zhou, Huijia Zhu, Weiqiang Wang, Zhongyi Liu, Xianpei Han, Le Sun 0001. 5659-5672 [doi]

Benchmarking Large Language Models on CFLUE - A Chinese Financial Language Understanding Evaluation DatasetJie Zhu, Junhui Li, Yalong Wen, Lifan Guo. 5673-5693 [doi]

Improving Large Language Models via Fine-grained Reinforcement Learning with Minimum Editing ConstraintZhipeng Chen, Kun Zhou 0002, Xin Zhao 0018, Junchen Wan, Fuzheng Zhang, Di Zhang, Ji-Rong Wen. 5694-5711 [doi]

Definition generation for lexical semantic change detectionMariia Fedorova, Andrey Kutuzov, Yves Scherrer. 5712-5724 [doi]

MuTox: Universal MUltilingual Audio-based TOXicity Dataset and Zero-shot DetectorMarta R. Costa-Jussà, Mariano Coria Meglioli, Pierre Andrews, David Dale, Prangthip Hansanti, Elahe Kalbassi, Alexandre Mourachko, Christophe Ropers, Carleigh Wood. 5725-5734 [doi]

Phased Instruction Fine-Tuning for Large Language ModelsWei Pang, Chuan Zhou 0013, Xiao-Hua Zhou, Xiaojie Wang. 5735-5748 [doi]

TOREE: Evaluating Topic Relevance of Student Essays for Chinese Primary and Middle School EducationXinlin Zhuang, Hongyi Wu, Xinshu Shen, Peimin Yu, Gaowei Yi, Xinhao Chen, Tu Hu, Yang Chen, Yupei Ren, Yadong Zhang, Youqi Song, Binxuan Liu, Man Lan. 5749-5765 [doi]

Predicting the Unpredictable: Uncertainty-Aware Reasoning over Temporal Knowledge Graphs via Diffusion ProcessYuxiang Cai, Qiao Liu 0003, Yanglei Gan, Changlin Li, Xueyi Liu, Run Lin, Da Luo, JiayeYang JiayeYang. 5766-5778 [doi]

Asymmetric Bias in Text-to-Image Generation with Adversarial AttacksHaz Sameen Shahgir, Xianghao Kong, Greg Ver Steeg, Yue Dong. 5779-5796 [doi]

Controlled Text Generation for Large Language Model with Dynamic Attribute GraphsXun Liang, Hanyu Wang, Shichao Song, Mengting Hu, Xunzhi Wang, Zhiyu Li, Feiyu Xiong, Bo Tang. 5797-5814 [doi]

Coconut: Contextualized Commonsense Unified Transformers for Graph-Based Commonsense Augmentation of Language ModelsJun-Hyung Park, Mingyu Lee, Junho Kim, SangKeun Lee 0001. 5815-5830 [doi]

Mass-Editing Memory with Attention in Transformers: A cross-lingual exploration of knowledgeDaniel Mela, Aitor Gonzalez-Agirre, Javier Hernando, Marta Villegas. 5831-5847 [doi]

BioMistral: A Collection of Open-Source Pretrained Large Language Models for Medical DomainsYanis Labrak, Adrien Bazoge, Emmanuel Morin, Pierre-Antoine Gourraud, Mickael Rouvier, Richard Dufour. 5848-5864 [doi]

All Languages Matter: On the Multilingual Safety of LLMsWenxuan Wang 0001, Zhaopeng Tu, Chang Chen, Youliang Yuan, Jen-tse Huang 0001, Wenxiang Jiao, Michael R. Lyu. 5865-5877 [doi]

LJPCheck: Functional Tests for Legal Judgment PredictionYuan Zhang, Wanhong Huang 0003, Yi Feng 0005, Chuanyi Li, Zhiwei Fei, JiDong Ge, Bin Luo 0003, Vincent Ng 0001. 5878-5894 [doi]

CMDL: A Large-Scale Chinese Multi-Defendant Legal Judgment Prediction DatasetWanhong Huang 0003, Yi Feng 0005, Chuanyi Li, Honghan Wu, JiDong Ge, Vincent Ng 0001. 5895-5906 [doi]

Model Editing by Standard Fine-TuningGovind Krishnan Gangadhar, Karl Stratos. 5907-5913 [doi]

Abstract Meaning Representation-Based Logic-Driven Data Augmentation for Logical ReasoningQiming Bao 0001, Alex Yuxuan Peng, Zhenyun Deng, Wanjun Zhong, Gaël Gendron, Timothy Pistotti, Neset Tan, Nathan Young, Yang Chen, Yonghua Zhu, Paul Denny 0001, Michael Witbrock, Jiamou Liu. 5914-5934 [doi]

CodeInsight: A Curated Dataset of Practical Coding Solutions from Stack OverflowNathanaël Beau, Benoît Crabbé. 5935-5947 [doi]

ViHateT5: Enhancing Hate Speech Detection in Vietnamese With a Unified Text-to-Text Transformer ModelLuan Thanh Nguyen. 5948-5961 [doi]

Bias in News Summarization: Measures, Pitfalls and CorporaJulius Steen, Katja Markert. 5962-5983 [doi]

When to Trust LLMs: Aligning Confidence with Response QualityShuchang Tao, Liuyi Yao, Hanxing Ding, Yuexiang Xie, Qi Cao, Fei Sun 0001, Jinyang Gao, Huawei Shen, Bolin Ding. 5984-5996 [doi]

Zero-shot Cross-lingual Alignment for Embedding InitializationXi Ai, Zhiyong Huang. 5997-6007 [doi]

Mitigating Hallucinations in Large Vision-Language Models (LVLMs) via Language-Contrastive Decoding (LCD)Avshalom Manevich, Reut Tsarfaty. 6008-6022 [doi]

It takes two to borrow: a donor and a recipient. Who's who?Liviu P. Dinu, Ana Sabina Uban, Anca Dinu, Ioan-Bogdan Iordache, Simona Georgescu, Laurentiu Zoicas. 6023-6035 [doi]

Advancing Post-OCR Correction: A Comparative Study of Synthetic DataShuhao Guan, Derek Greene. 6036-6047 [doi]

GeoAgent: To Empower LLMs using Geospatial Tools for Address StandardizationChenghua Huang, Shisong Chen, Zhixu Li, Jianfeng Qu, Yanghua Xiao, Jiaxin Liu, Zhigang Chen 0003. 6048-6063 [doi]

HQP: A Human-Annotated Dataset for Detecting Online PropagandaAbdurahman Maarouf, Dominik Bär, Dominique Geissler, Stefan Feuerriegel. 6064-6089 [doi]

Teaching Language Models to Self-Improve by Learning from Language FeedbackChi Hu, Yimin Hu, Hang Cao, Tong Xiao, Jingbo Zhu. 6090-6101 [doi]

Exploring Spatial Schema Intuitions in Large Language and Vision ModelsPhilipp Wicke, Lennart Wachowiak. 6102-6117 [doi]

Efficient Detection of LLM-generated Texts with a Bayesian Surrogate ModelYibo Miao, Hongcheng Gao, Hao Zhang, Zhijie Deng. 6118-6130 [doi]

Decoding the Narratives: Analyzing Personal Drug Experiences Shared on RedditLayla Bouzoubaa, Elham Aghakhani, Max Song, Quang Trinh, Rezvaneh (Shadi) Rezapour. 6131-6148 [doi]

Unveiling the Art of Heading Design: A Harmonious Blend of Summarization, Neology, and AlgorithmShaobo Cui 0006, Yiyang Feng, Yisong Mao, Yifan Hou, Boi Faltings. 6149-6174 [doi]

Understanding Fine-grained Distortions in Reports of Scientific FindingsAmelie Wührl, Dustin Wright 0001, Roman Klinger, Isabelle Augenstein. 6175-6191 [doi]

MM-SOC: Benchmarking Multimodal Large Language Models in Social Media PlatformsYiqiao Jin, Minje Choi, Gaurav Verma, Jindong Wang 0001, Srijan Kumar. 6192-6210 [doi]

Instances Need More Care: Rewriting Prompts for Instances with LLMs in the Loop Yields Better Zero-Shot PerformanceSaurabh Srivastava, Chengyue Huang, Weiguo Fan, Ziyu Yao. 6211-6232 [doi]

Benchmarking Retrieval-Augmented Generation for MedicineGuangzhi Xiong, Qiao Jin 0001, Zhiyong Lu, Aidong Zhang. 6233-6251 [doi]

ChatMusician: Understanding and Generating Music Intrinsically with LLMRuibin Yuan, Hanfeng Lin, Yi Wang 0033, Zeyue Tian, Shangda Wu, Tianhao Shen, Ge Zhang, Yuhang Wu, Cong Liu, Ziya Zhou, Liumeng Xue, Ziyang Ma, Qin Liu, Tianyu Zheng, Yizhi Li, Yinghao Ma, Yiming Liang, Xiaowei Chi, Ruibo Liu, Zili Wang, Chenghua Lin, Qifeng Liu, Tao Jiang, Wenhao Huang, Wenhu Chen, Jie Fu, Emmanouil Benetos, Gus Xia, Roger B. Dannenberg, Wei Xue, Shiyin Kang, Yike Guo. 6252-6271 [doi]

Towards Robust Temporal Reasoning of Large Language Models via a Multi-Hop QA Dataset and Pseudo-Instruction TuningQingyu Tan, Hwee Tou Ng, Lidong Bing. 6272-6286 [doi]

Mind Your Format: Towards Consistent Evaluation of In-Context Learning ImprovementsAnton Voronov, Lena Wolf, Max Ryabinin. 6287-6310 [doi]

Knowledge Graph-Enhanced Large Language Models via Path SelectionHaochen Liu, Song Wang, Yaochen Zhu, Yushun Dong, Jundong Li. 6311-6321 [doi]

OTTAWA: Optimal TransporT Adaptive Word Aligner for Hallucination and Omission Translation Errors DetectionChenyang Huang 0001, Abbas Ghaddar, Ivan Kobyzev, Mehdi Rezagholizadeh, Osmar Zaïane, Boxing Chen. 6322-6334 [doi]

ONSEP: A Novel Online Neural-Symbolic Framework for Event Prediction Based on Large Language ModelXuanqing Yu, Wangtao Sun, Jingwei Li, Kang Liu, Chengbao Liu, Jie Tan. 6335-6350 [doi]

Speech-based Slot Filling using Large Language ModelsGuangzhi Sun, Shutong Feng, Dongcheng Jiang, Chao Zhang 0031, Milica Gasic, Philip C. Woodland. 6351-6362 [doi]

Too Big to Fail: Larger Language Models are Disproportionately Resilient to Induction of Dementia-Related Linguistic AnomaliesChangye Li, Zhecheng Sheng, Trevor Cohen, Serguei Pakhomov. 6363-6377 [doi]

HeSum: a Novel Dataset for Abstractive Text Summarization in HebrewTzuf Paz-Argaman, Itai Mondshine, Asaf Achi Mordechai, Reut Tsarfaty. 6378-6388 [doi]

TRAM: Benchmarking Temporal Reasoning for Large Language ModelsYuqing Wang, Yun Zhao 0001. 6389-6415 [doi]

Knowledge of Knowledge: Exploring Known-Unknowns Uncertainty with Large Language ModelsAlfonso Amayuelas, Kyle Wong, Liangming Pan, Wenhu Chen, William Yang Wang. 6416-6432 [doi]

Exploring Defeasibility in Causal ReasoningShaobo Cui 0006, Lazar Milikic, Yiyang Feng, Mete Ismayilzada, Debjit Paul, Antoine Bosselut, Boi Faltings. 6433-6452 [doi]

Better Synthetic Data by Retrieving and Transforming Existing DatasetsSaumya Gandhi, Ritu Gala, Vijay Viswanathan 0002, Tongshuang Wu, Graham Neubig. 6453-6466 [doi]

Addressing Order Sensitivity of In-Context Demonstration Examples in Causal Language ModelsYanzheng Xiang, Hanqi Yan, Lin Gui 0003, Yulan He 0001. 6467-6481 [doi]

Perspective Taking through Generating Responses to Conflict SituationsJoan Plepi, Charles Welch, Lucie Flek. 6482-6497 [doi]

LLM2LLM: Boosting LLMs with Novel Iterative Data EnhancementNicholas Lee, Thanakul Wattanawong, Sehoon Kim, Karttikeya Mangalam, Sheng Shen, Gopala Anumanchipalli, Michael W. Mahoney, Kurt Keutzer, Amir Gholami. 6498-6526 [doi]

The Power of Summary-Source AlignmentsOri Ernst, Ori Shapira, Aviv Slobodkin, Sharon Adar, Mohit Bansal, Jacob Goldberger, Ran Levy 0001, Ido Dagan. 6527-6548 [doi]

An Experimental Design Framework for Label-Efficient Supervised Finetuning of Large Language ModelsGantavya Bhatt, Yifang Chen, Arnav Mohanty Das, Jifan Zhang, Sang T. Truong, Stephen Mussmann, Yinglun Zhu, Jeff A. Bilmes, Simon S. Du, Kevin G. Jamieson, Jordan T. Ash, Robert D. Nowak. 6549-6560 [doi]

Learning Multimodal Contrast with Cross-modal Memory and Reinforced Contrast RecognitionYuanhe Tian, Fei Xia, Yan Song. 6561-6573 [doi]

Text Simplification via Adaptive TeachingSeyed Ali Bahrainian, Jonathan Dou, Carsten Eickhoff. 6574-6584 [doi]

A multi-level multi-label text classification dataset of 19th century Ottoman and Russian literary and critical textsGokcen Gokceoglu, Devrim Cavusoglu, Emre Akbas, Özen Nergis Dolcerocca. 6585-6596 [doi]

It is Simple Sometimes: A Study On Improving Aspect-Based Sentiment Analysis PerformanceLaura Cabello, Uchenna Akujuobi. 6597-6610 [doi]

Whose Emotions and Moral Sentiments do Language Models Reflect?Zihao He, Siyi Guo, Ashwin Rao, Kristina Lerman. 6611-6631 [doi]

LLM can Achieve Self-Regulation via Hyperparameter Aware GenerationSiyin Wang, Shimin Li, Tianxiang Sun, JinLan Fu, Qinyuan Cheng, Jiasheng Ye, Junjie Ye, Xipeng Qiu, Xuanjing Huang 0001. 6632-6646 [doi]

Forward-Backward Reasoning in Large Language Models for Mathematical VerificationWeisen Jiang, Han Shi, Longhui Yu, Zhengying Liu, Yu Zhang 0006, Zhenguo Li, James T. Kwok. 6647-6661 [doi]

Towards Uncertainty-Aware Language AgentJiuzhou Han, Wray L. Buntine, Ehsan Shareghi. 6662-6685 [doi]

Detection and Positive Reconstruction of Cognitive Distortion Sentences: Mandarin Dataset and EvaluationShuya Lin, Yuxiong Wang, Jonathan Dong, Shiguang Ni. 6686-6701 [doi]

PiVe: Prompting with Iterative Verification Improving Graph-based Generative Capability of LLMsJiuzhou Han, Nigel Collier, Wray L. Buntine, Ehsan Shareghi. 6702-6718 [doi]

Two-stage Generative Question Answering on Temporal Knowledge Graph Using Large Language ModelsYifu Gao, Linbo Qiao, Zhigang Kan, Zhihua Wen, Yongquan He, Dongsheng Li 0001. 6719-6734 [doi]

VISREAS: Complex Visual Reasoning with Unanswerable QuestionsSyeda Nahida Akter, Sangwu Lee, Yingshan Chang, Yonatan Bisk, Eric Nyberg. 6735-6752 [doi]

A Unified Generative Framework for Bilingual Euphemism Detection and IdentificationYuxue Hu, Junsong Li, Tongguan Wang, Dongyu Su, Guixin Su, Ying Sha. 6753-6766 [doi]

StyleDubber: Towards Multi-Scale Style Learning for Movie DubbingGaoxiang Cong, Yuankai Qi, Liang Li 0003, Amin Beheshti, Zhedong Zhang, Anton van den Hengel, Ming-Hsuan Yang 0001, Chenggang Yan 0001, Qingming Huang. 6767-6779 [doi]

ETAS: Zero-Shot Transformer Architecture Search via Network Trainability and ExpressivityJiechao Yang, Yong Liu. 6780-6795 [doi]

Reasoning Like a Doctor: Improving Medical Dialogue Systems via Diagnostic Reasoning Process AlignmentKaishuai Xu, Yi Cheng, Wenjun Hou, Qiaoyu Tan, Wenjie Li. 6796-6814 [doi]

ConceptMath: A Bilingual Concept-wise Benchmark for Measuring Mathematical Reasoning of Large Language ModelsYanan Wu, Jie Liu, Xingyuan Bu, Jiaheng Liu, Zhanhui Zhou, Yuanxing Zhang, Chenchen Zhang, ZhiqiBai ZhiqiBai, Haibin Chen, Tiezheng Ge, Wanli Ouyang, Wenbo Su, Bo Zheng 0007. 6815-6839 [doi]

REInstruct: Building Instruction Data from Unlabeled CorpusShu Chen, Xinyan Guan, Yaojie Lu 0001, Hongyu Lin, Xianpei Han, Le Sun 0001. 6840-6856 [doi]

Learning to Maximize Mutual Information for Chain-of-Thought DistillationXin Chen, Hanxian Huang, Yanjun Gao, Yi Wang 0031, Jishen Zhao, Ke Ding. 6857-6868 [doi]

PEMT: Multi-Task Correlation Guided Mixture-of-Experts Enables Parameter-Efficient Transfer LearningZhisheng Lin, Han Fu, Chenghao Liu, Zhuo Li, Jianling Sun. 6869-6883 [doi]

MathBench: Evaluating the Theory and Application Proficiency of LLMs with a Hierarchical Mathematics BenchmarkHongwei Liu, Zilong Zheng, Yuxuan Qiao, Haodong Duan, Zhiwei Fei, Fengzhe Zhou, Wenwei Zhang, Songyang Zhang, Dahua Lin, Kai Chen 0026. 6884-6915 [doi]

Identifying Semantic Induction Heads to Understand In-Context LearningJie Ren 0018, Qipeng Guo, Hang Yan 0001, Dongrui Liu, Quanshi Zhang, Xipeng Qiu, Dahua Lin. 6916-6932 [doi]

Chinese Spelling Corrector Is Just a Language LearnerLai Jiang, Hongqiu Wu, Hai Zhao 0001, Min Zhang 0005. 6933-6943 [doi]

Logical Closed Loop: Uncovering Object Hallucinations in Large Vision-Language ModelsJunfei Wu, Qiang Liu 0006, Ding Wang, Jinghao Zhang, Shu Wu, Liang Wang 0001, Tieniu Tan. 6944-6962 [doi]

RetrievalQA: Assessing Adaptive Retrieval-Augmented Generation for Short-form Open-Domain Question AnsweringZihan Zhang, Meng Fang, Ling Chen. 6963-6975 [doi]

LLaST: Improved End-to-end Speech Translation System Leveraged by Large Language ModelsXi Chen, Songyang Zhang, Qibing Bai, Kai Chen, Satoshi Nakamura. 6976-6987 [doi]

Plan, Generate and Complicate: Improving Low-resource Dialogue State Tracking via Easy-to-Difficult Zero-shot Data AugmentationMing Gu, Yan Yang 0008. 6988-7005 [doi]

DMoERM: Recipes of Mixture-of-Experts for Effective Reward ModelingShanghaoran Quan. 7006-7028 [doi]

LEIA: Facilitating Cross-lingual Knowledge Transfer in Language Models with Entity-based Data AugmentationIkuya Yamada, Ryokan Ri. 7029-7039 [doi]

Comments as Natural Logic Pivots: Improve Code Generation via Comment PerspectiveYijie Chen, Yijin Liu, Fandong Meng, Yufeng Chen 0005, Jinan Xu, Jie Zhou 0016. 7040-7051 [doi]

Cocktail: A Comprehensive Information Retrieval Benchmark with LLM-Generated Documents IntegrationSunhao Dai, Weihao Liu, Yuqi Zhou, Liang Pang, Rongju Ruan, Gang Wang, Zhenhua Dong, Jun Xu 0001, Ji-Rong Wen. 7052-7074 [doi]

Continual Dialogue State Tracking via Reason-of-Select DistillationYujie Feng, Bo Liu 0049, Xiaoyu Dong, Zexin Lu, Li-Ming Zhan, Xiao-Ming Wu 0003, Albert Y. S. Lam. 7075-7087 [doi]

Spotting AI's Touch: Identifying LLM-Paraphrased Spans in TextYafu Li, Zhilin Wang, Leyang Cui, Wei Bi, Shuming Shi 0001, Yue Zhang 0004. 7088-7107 [doi]

SoFA: Shielded On-the-fly Alignment via Priority Rule FollowingXinyu Lu, Bowen Yu 0002, Yaojie Lu 0001, Hongyu Lin, Haiyang Yu, Le Sun 0001, Xianpei Han, Yongbin Li. 7108-7136 [doi]

Do Zombies Understand? A Choose-Your-Own-Adventure Exploration of Machine CognitionAriel Goldstein, Gabriel Stanovsky. 7137-7143 [doi]

Modeling Emotional Trajectories in Written Stories Utilizing Transformers and Weakly-Supervised LearningLukas Christ, Shahin Amiriparian, Manuel Milling, Ilhan Aslan, Björn W. Schuller. 7144-7159 [doi]

RAP: Efficient Text-Video Retrieval with Sparse-and-Correlated AdapterMeng Cao, Haoran Tang, Jinfa Huang, Peng Jin, Can Zhang 0001, Ruyang Liu, Long Chen 0016, Xiaodan Liang, Li Yuan, Ge Li 0002. 7160-7174 [doi]

Benchmarking and Improving Long-Text Translation with Large Language ModelsLongyue Wang, Zefeng Du, Wenxiang Jiao, Chenyang Lyu, Jianhui Pang, Leyang Cui, Kaiqiang Song, Derek F. Wong, Shuming Shi 0001, Zhaopeng Tu. 7175-7187 [doi]

Personalized Topic Selection Model for Topic-Grounded DialogueShixuan Fan, Wei Wei 0002, Xiaofei Wen, Xian-Ling Mao, Jixiong Chen, Dangyang Chen. 7188-7202 [doi]

Debiasing In-Context Learning by Instructing LLMs How to Follow DemonstrationsLvxue Li, Jiaqi Chen, Xinyu Lu, Yaojie Lu 0001, Hongyu Lin, Shuheng Zhou, Huijia Zhu, Weiqiang Wang, Zhongyi Liu, Xianpei Han, Le Sun 0001. 7203-7215 [doi]

Comparing Data Augmentation Methods for End-to-End Task-Oriented Dialog SystemsChristos Vlachos, Themos Stafylakis, Ion Androutsopoulos. 7216-7240 [doi]

MS2SL: Multimodal Spoken Data-Driven Continuous Sign Language ProductionJian Ma, Wenguan Wang, Yi Yang 0001, Feng Zheng. 7241-7254 [doi]

BBA: Bi-Modal Behavioral Alignment for Reasoning with Large Vision-Language ModelsXueliang Zhao, Xinting Huang, Tingchen Fu, Qintong Li, Shansan Gong, Lemao Liu, Wei Bi, Lingpeng Kong. 7255-7279 [doi]

PartialFormer: Modeling Part Instead of Whole for Machine TranslationTong Zheng, Bei Li, Huiwen Bao, Jiale Wang, Weiqiao Shan, Tong Xiao, Jingbo Zhu. 7280-7294 [doi]

Self-Consistent Reasoning-based Aspect-Sentiment Quad Prediction with Extract-Then-Assign StrategyJieyong Kim, Ryang Heo, Yongsik Seo, SeongKu Kang, Jinyoung Yeo, Dongha Lee. 7295-7303 [doi]

PACE: Improving Prompt with Actor-Critic Editing for Large Language ModelYihong Dong, Kangcheng Luo, Xue Jiang, Zhi Jin, Ge Li. 7304-7323 [doi]

Penetrative AI: Making LLMs Comprehend the Physical WorldHuatao Xu, Liying Han, Qirui Yang, Mo Li 0001, Mani B. Srivastava. 7324-7341 [doi]

The Impact of Demonstrations on Multilingual In-Context Learning: A Multidimensional AnalysisMiaoran Zhang, Vagrant Gautam, Mingyang Wang, Jesujoba Alabi, Xiaoyu Shen 0001, Dietrich Klakow, Marius Mosbach. 7342-7371 [doi]

Rich Semantic Knowledge Enhanced Large Language Models for Few-shot Chinese Spell CheckingMing Dong, Yujing Chen, Miao Zhang, Hao Sun, Tingting He. 7372-7383 [doi]

An Empirical Study of In-context Learning in LLMs for Machine TranslationPranjal A. Chitale, Jay P. Gala, Raj Dabre. 7384-7406 [doi]

"My Answer is C": First-Token Probabilities Do Not Match Text Answers in Instruction-Tuned Language ModelsXinpeng Wang 0003, Bolei Ma, Chengzhi Hu, Leon Weber-Genzel, Paul Röttger, Frauke Kreuter, Dirk Hovy, Barbara Plank. 7407-7416 [doi]

ODA: Observation-Driven Agent for integrating LLMs and Knowledge GraphsLei Sun, Zhengwei Tao, Youdi Li, Hiroshi Arakawa. 7417-7431 [doi]

A Comprehensive Study of Jailbreak Attack versus Defense for Large Language ModelsZihao Xu, Yi Liu, Gelei Deng, Yuekang Li, Stjepan Picek. 7432-7449 [doi]

A Data-Driven Guided Decoding Mechanism for Diagnostic CaptioningPanagiotis Kaliosis, John Pavlopoulos, Foivos Charalampakos, Georgios Moschovis, Ion Androutsopoulos. 7450-7466 [doi]

Balancing Speciality and Versatility: a Coarse to Fine Framework for Supervised Fine-tuning Large Language ModelHengyuan Zhang, Yanru Wu, Dawei Li, Sak Yang, Rui Zhao, Yong Jiang, Fei Tan. 7467-7509 [doi]

A Two-Agent Game for Zero-shot Relation Triplet ExtractionTing Xu 0003, Haiqin Yang, Fei Zhao, Zhen Wu, Xinyu Dai. 7510-7527 [doi]

Light-PEFT: Lightening Parameter-Efficient Fine-Tuning via Early PruningNaibin Gu, Peng Fu 0008, Xiyu Liu 0003, Bowen Shen, Zheng Lin 0001, Weiping Wang 0005. 7528-7541 [doi]

Building Bridges: A Dataset for Evaluating Gender-Fair Machine Translation into GermanManuel Lardelli, Giuseppe Attanasio, Anne Lauscher. 7542-7550 [doi]

Prompt Chaining or Stepwise Prompt? Refinement in Text SummarizationShichao Sun, Ruifeng Yuan, Ziqiang Cao, Wenjie Li 0002, Pengfei Liu 0003. 7551-7558 [doi]

Trust in Internal or External Knowledge? Generative Multi-Modal Entity Linking with Knowledge RetrieverXinwei Long, Jiali Zeng, Fandong Meng, Jie Zhou, Bowen Zhou. 7559-7569 [doi]

A Semantic Distance Metric Learning approach for Lexical Semantic Change DetectionTaichi Aida, Danushka Bollegala. 7570-7584 [doi]

What Have We Achieved on Non-autoregressive Translation?Yafu Li, Huajian Zhang, Jianhao Yan, Yongjing Yin, Yue Zhang 0004. 7585-7606 [doi]

From Zero to Hero: Cold-Start Anomaly DetectionTal Reiss, George Kour, Naama Zwerdling, Ateret Anaby-Tavor, Yedid Hoshen. 7607-7617 [doi]

Large Language Models Fall Short: Understanding Complex Relationships in Detective NarrativesRuncong Zhao, Qinglin Zhu, Hainiu Xu, Jiazheng Li 0002, Yuxiang Zhou, Yulan He 0001, Lin Gui 0003. 7618-7638 [doi]

DistillMIKE: Editing Distillation of Massive In-Context Knowledge Editing in Large Language ModelsShanbao Qiao, Xuebing Liu, Seung-Hoon Na. 7639-7654 [doi]

Unlocking Efficiency in Large Language Model Inference: A Comprehensive Survey of Speculative DecodingHeming Xia, Zhe Yang, Qingxiu Dong, Peiyi Wang, Yongqi Li 0001, Tao Ge 0001, Tianyu Liu 0001, Wenjie Li 0002, Zhifang Sui. 7655-7671 [doi]

Hierarchy-aware Biased Bound Margin Loss Function for Hierarchical Text ClassificationGibaeg Kim, Sanghun Im, Heung-Seon Oh. 7672-7682 [doi]

Improving Retrieval Augmented Open-Domain Question-Answering with Vectorized ContextsZhuo Chen, Xinyu Wang 0013, Yong Jiang 0001, Pengjun Xie, Fei Huang 0004, Kewei Tu. 7683-7694 [doi]

CICLe: Conformal In-Context Learning for Largescale Multi-Class Food Risk ClassificationKorbinian Randl, John Pavlopoulos, Aron Henriksson, Tony Lindgren. 7695-7715 [doi]

IntactKV: Improving Large Language Model Quantization by Keeping Pivot Tokens IntactRuikang Liu, Haoli Bai, Haokun Lin, Yuening Li, Han Gao, Zhengzhuo Xu, Lu Hou, Jun Yao, Chun Yuan. 7716-7741 [doi]

Learning Adverbs with Spectral Mixture KernelsTomoe Taniguchi, Daichi Mochihashi, Ichiro Kobayashi. 7742-7752 [doi]

E-EVAL: A Comprehensive Chinese K-12 Education Evaluation Benchmark for Large Language ModelsJinchang Hou, Chang Ao, Haihong Wu, Xiangtao Kong, Zhigang Zheng, Daijia Tang, Chengming Li, Xiping Hu 0001, Ruifeng Xu, Shiwen Ni, Min Yang 0007. 7753-7774 [doi]

ChartAssistant: A Universal Chart Multimodal Language Model via Chart-to-Table Pre-training and Multitask Instruction TuningFanqing Meng, Wenqi Shao, Quanfeng Lu, Peng Gao, Kaipeng Zhang, Yu Qiao, Ping Luo. 7775-7803 [doi]

Teaching Small Language Models to Reason for Knowledge-Intensive Multi-Hop Question AnsweringXiang Li, Shizhu He, Fangyu Lei, JunYang JunYang, Tianhuang Su, Kang Liu 0001, Jun Zhao 0001. 7804-7816 [doi]

ALaRM: Align Language Models via Hierarchical Rewards ModelingYuhang Lai, Siyuan Wang, Shujun Liu, Xuanjing Huang, Zhongyu Wei. 7817-7831 [doi]

LSTPrompt: Large Language Models as Zero-Shot Time Series Forecasters by Long-Short-Term PromptingHaoxin Liu, Zhiyuan Zhao, Jindong Wang, Harshavardhan Kamarthi, B. Aditya Prakash. 7832-7840 [doi]

Mitigating Boundary Ambiguity and Inherent Bias for Text Classification in the Era of Large Language ModelsZhenyi Lu, Jie Tian, Wei Wei 0002, Xiaoye Qu, Yu Cheng 0001, Wenfeng Xie, Dangyang Chen. 7841-7864 [doi]

UOR: Universal Backdoor Attacks on Pre-trained Language ModelsWei Du, Peixuan Li, Haodong Zhao, Tianjie Ju, Ge Ren, Gongshen Liu. 7865-7877 [doi]

Language models emulate certain cognitive profiles: An investigation of how predictability measures interact with individual differencesPatrick Haller 0001, Lena S. Bolliger, Lena Ann Jäger. 7878-7892 [doi]

The State of Relation Extraction Data Quality: Is Bigger Always Better?Erica Cai, Brendan T. O'Connor 0001. 7893-7906 [doi]

NaturalCodeBench: Examining Coding Performance Mismatch on HumanEval and Natural User QueriesShudan Zhang, Hanlin Zhao, Xiao Liu 0036, Qinkai Zheng, Zehan Qi, Xiaotao Gu, Yuxiao Dong, Jie Tang. 7907-7928 [doi]

LLMCrit: Teaching Large Language Models to Use CriteriaWeizhe Yuan, Pengfei Liu 0003, Matthias Gallé. 7929-7960 [doi]

Empowering cross-lingual abilities of instruction-tuned large language models by translation-following demonstrationsLeonardo Ranaldi, Giulia Pucci, André Freitas. 7961-7973 [doi]

Ranking Entities along Conceptual Space Dimensions with LLMs: An Analysis of Fine-Tuning StrategiesNitesh Kumar, Usashi Chatterjee, Steven Schockaert. 7974-7989 [doi]

Efficient k-Nearest-Neighbor Machine Translation with Dynamic RetrievalYan Gao, Zhiwei Cao, Zhongjian Miao, Baosong Yang, Shiyu Liu, Min Zhang 0005, Jinsong Su. 7990-8001 [doi]

Symmetric Dot-Product Attention for Efficient Training of BERT Language ModelsMartin Courtois, Malte Ostendorff, Leonhard Hennig, Georg Rehm. 8002-8011 [doi]

Synthesizing Conversations from Unlabeled Documents using Automatic Response SegmentationFanyou Wu, Weijie Xu, Chandan K. Reddy, Srinivasan Sengamedu. 8012-8026 [doi]

Can Large Language Models Follow Concept Annotation Guidelines? A Case Study on Scientific and Financial DomainsMarcio Fonseca, Shay B. Cohen. 8027-8042 [doi]

Alignment-Based Decoding Policy for Low-Latency and Anticipation-Free Neural Japanese Input Method EditorsArmin Sarhangzadeh, Taro Watanabe. 8043-8054 [doi]

ECoK: Emotional Commonsense Knowledge Graph for Mining Emotional GoldZhunheng Wang, Xiaoyi Liu, Mengting Hu, Rui Ying, Ming Jiang, Jianfeng Wu, Yalan Xie, Hang Gao, Renhong Cheng. 8055-8074 [doi]

Deterministic Reversible Data Augmentation for Neural Machine TranslationJiashu Yao, Heyan Huang, Zeming Liu, Yuhang Guo 0001. 8075-8089 [doi]

Latent Learningscape Guided In-context LearningAnlai Zhou, Sunshine Jiang, YiFei Liu, Yiquan Wu, Kun Kuang, Jun Xiao. 8090-8101 [doi]

SMR: State Memory Replay for Long Sequence ModelingBiqing Qi, Junqi Gao, Kaiyan Zhang, Dong Li, Jianxing Liu, Ligang Wu, Bowen Zhou. 8102-8116 [doi]

Characterizing Large Language Models as Rationalizers of Knowledge-intensive TasksAditi Mishra, Sajjadur Rahman, Kushan Mitra, Hannah Kim 0001, Estevam Hruschka. 8117-8139 [doi]

Challenging Large Language Models with New Tasks: A Study on their Adaptability and RobustnessChenxi Li, Yuanhe Tian, Zhaxi Zerong, Yan Song, Fei Xia. 8140-8162 [doi]

Linear Cross-Lingual Mapping of Sentence EmbeddingsOleg Vasilyev, Fumika Isono, John Bohannon. 8163-8171 [doi]

ULTRA: Unleash LLMs' Potential for Event Argument Extraction through Hierarchical Modeling and Pair-wise Self-RefinementXinliang Frederick Zhang, Carter Wood Blum, Temma Choji, Shalin Shah, Alakananda Vempala. 8172-8185 [doi]

LLMs Beyond English: Scaling the Multilingual Capability of LLMs with Cross-Lingual FeedbackWen Lai, Mohsen Mesgar, Alexander Fraser 0001. 8186-8213 [doi]

BASS: Batched Attention-optimized Speculative SamplingHaifeng Qian, Sujan Kumar Gonugondla, Sungsoo Ha, Mingyue Shang, Sanjay Krishna Gouda, Ramesh Nallapati, Sudipta Sengupta, Xiaofei Ma 0001, Anoop Deoras. 8214-8224 [doi]

Deciphering Digital Detectives: Understanding LLM Behaviors and Capabilities in Multi-Agent Mystery GamesDekun Wu, Haochen Shi, Zhiyuan Sun, Bang Liu. 8225-8291 [doi]

It Is Not About What You Say, It Is About How You Say It: A Surprisingly Simple Approach for Improving Reading ComprehensionSagi Shaier, Lawrence Hunter, Katharina von der Wense. 8292-8305 [doi]

Large Language Models Relearn Removed ConceptsMichelle Lo, Fazl Barez, Shay B. Cohen. 8306-8323 [doi]

Towards Unified Task Embeddings Across Multiple Models: Bridging the Gap for Prompt-Based Large Language Models and BeyondXinyu Wang, Hainiu Xu, Lin Gui 0003, Yulan He 0001. 8324-8340 [doi]

TOAD: Task-Oriented Automatic Dialogs with Diverse Response StylesYinhong Liu, Yimai Fang, David Vandyke, Nigel Collier. 8341-8356 [doi]

Machine-Generated Text LocalizationZhongping Zhang, Wenda Qin, Bryan A. Plummer. 8357-8371 [doi]

BenchIE⌃FL: A Manually Re-Annotated Fact-Based Open Information Extraction BenchmarkFabrice Lamarche, Philippe Langlais. 8372-8394 [doi]

CausalCite: A Causal Formulation of Paper CitationsIshan Agrawal, Zhijing Jin, Ehsan Mokhtarian, Siyuan Guo, Yuen Chen, Mrinmaya Sachan, Bernhard Schölkopf. 8395-8410 [doi]

Question Translation Training for Better Multilingual ReasoningWenhao Zhu, Shujian Huang, Fei Yuan, Shuaijie She, Jiajun Chen, Alexandra Birch. 8411-8423 [doi]

Improving LLM Generations via Fine-Grained Self-EndorsementAnte Wang, Linfeng Song, Baolin Peng, Lifeng Jin, Ye Tian, Haitao Mi, Jinsong Su, Dong Yu 0001. 8424-8436 [doi]

Multi-Label Classification for Implicit Discourse Relation RecognitionWanqiu Long, Siddharth Narayanaswamy, Bonnie Webber. 8437-8451 [doi]

StudentEval: A Benchmark of Student-Written Prompts for Large Language Models of CodeHannah McLean Babe, Sydney Nguyen, Yangtian Zi, Arjun Guha, Molly Q. Feldman, Carolyn Jane Anderson. 8452-8474 [doi]

ProLex: A Benchmark for Language Proficiency-oriented Lexical SubstitutionXuanming Zhang, Zixun Chen, Zhou Yu 0005. 8475-8493 [doi]

Generating Diverse and High-Quality Texts by Minimum Bayes Risk DecodingYuu Jinnai, Ukyo Honda, Tetsuro Morimura, Peinan Zhang. 8494-8525 [doi]

GATE X-E : A Challenge Set for Gender-Fair Translations from Weakly-Gendered LanguagesSpencer Rarrick, Ranjita Naik, Sundar Poudel, Vishal Chowdhary. 8526-8546 [doi]

Hyperparameter-Free Approach for Faster Minimum Bayes Risk DecodingYuu Jinnai, Kaito Ariu. 8547-8566 [doi]

Simplifying Translations for Children: Iterative Simplification Considering Age of Acquisition with LLMsMasashi Oshika, Makoto Morishita, Tsutomu Hirao, Ryohei Sasano, Koichi Takeda 0003. 8567-8577 [doi]

Bi-Chainer: Automated Large Language Models Reasoning with Bidirectional ChainingShuqi Liu, Bowei He, Linqi Song. 8578-8598 [doi]

Can Large Language Model Summarizers Adapt to Diverse Scientific Communication Goals?Marcio Fonseca, Shay B. Cohen. 8599-8618 [doi]

Knowledge Context Modeling with Pre-trained Language Models for Contrastive Knowledge Graph CompletionGuangqian Yang, Yi Liu, Lei Zhang 0119, Licheng Zhang, Hongtao Xie, Zhendong Mao. 8619-8630 [doi]

Stronger, Lighter, Better: Towards Life-Long Attribute Value Extraction for E-Commerce ProductsTao Zhang 0055, Chenwei Zhang, Xian Li, Jingbo Shang, Hoang Nguyen, Philip S. Yu. 8631-8643 [doi]

Exploring Domain Robust Lightweight Reward Models based on Router MechanismHyuk Namgoong, Jeesu Jung, Sangkeun Jung, Yoon-Hyung Roh. 8644-8652 [doi]

Generalized Category Discovery with Large Language Models in the LoopWenbin An, Wenkai Shi, Feng Tian 0002, Haonan Lin, QianYing Wang, Yaqiang Wu, Mingxiang Cai, Luyan Wang, Yan Chen 0031, Haiping Zhu, Ping Chen 0001. 8653-8665 [doi]

VAEGPT-Sim: Improving Sentence Representation with Limited Corpus Using Gradually-Denoising VAEZhenyi Wang, Haiyan Ning, Qing Ling, Dan Wang. 8666-8681 [doi]

PPTC Benchmark: Evaluating Large Language Models for PowerPoint Task CompletionYiduo Guo, Zekai Zhang, Yaobo Liang, Dongyan Zhao 0001, Nan Duan. 8682-8701 [doi]

Fact-and-Reflection (FaR) Improves Confidence Calibration of Large Language ModelsXinran Zhao, Hongming Zhang 0009, Xiaoman Pan, Wenlin Yao, Dong Yu, Tongshuang Wu, Jianshu Chen. 8702-8718 [doi]

DB-LLM: Accurate Dual-Binarization for Efficient LLMsHong Chen 0004, Chengtao Lv, Liang Ding 0006, Haotong Qin, Xiabin Zhou, Yifu Ding, Xuebo Liu 0002, Min Zhang 0005, Jinyang Guo, Xianglong Liu 0001, Dacheng Tao. 8719-8730 [doi]

TempCompass: Do Video LLMs Really Understand Videos?Yuanxin Liu, Shicheng Li, Yi Liu, Yuxiang Wang, Shuhuai Ren, Lei Li, Sishuo Chen, Xu Sun, Lu Hou. 8731-8772 [doi]

"Get Their Hands Dirty, Not Mine": On Researcher-Annotator Collaboration and the Agency of AnnotatorsShengqi Zhu, Jeffrey M. Rzeszotarski. 8773-8782 [doi]

Teaching Large Language Models an Unseen Language on the FlyChen Zhang 0019, Xiao Liu 0032, Jiuheng Lin, Yansong Feng. 8783-8800 [doi]

Error Analysis Prompting Enables Human-Like Translation Evaluation in Large Language ModelsQingyu Lu, Baopu Qiu, Liang Ding 0006, Kanjian Zhang, Tom Kocmi, Dacheng Tao. 8801-8816 [doi]

GAOKAO-MM: A Chinese Human-Level Benchmark for Multimodal Models EvaluationYi Zong, Xipeng Qiu. 8817-8825 [doi]

DiffChat: Learning to Chat with Text-to-Image Synthesis Models for Interactive Image CreationJiapeng Wang, Chengyu Wang 0001, Tingfeng Cao, Jun Huang 0007, Lianwen Jin. 8826-8840 [doi]

Revisiting Parallel Context Windows: A Frustratingly Simple Alternative and Chain-of-Thought DeteriorationKejuan Yang, Xiao Liu 0036, Kaiwen Men, Aohan Zeng, Yuxiao Dong, Jie Tang. 8841-8852 [doi]

Rationales for Answers to Simple Math Word Problems Confuse Large Language ModelsYidan Zhang, Mingfeng Xue, Dayiheng Liu, Zhenan He 0001. 8853-8869 [doi]

ResLoRA: Identity Residual Mapping in Low-Rank AdaptionShuhua Shi, Shaohan Huang, Minghui Song, Zhoujun Li, Zihan Zhang, Haizhen Huang, Furu Wei, Weiwei Deng, Feng Sun 0008, Qi Zhang 0066. 8870-8884 [doi]

Towards Objectively Benchmarking Social Intelligence of Language Agents at the Action LevelChenxu Wang, Bin Dai, Huaping Liu, Baoyuan Wang. 8885-8897 [doi]

Semantic Role Labeling from Chinese Speech via End-to-End LearningHuiyao Chen, Xinxin Li, Meishan Zhang, Min Zhang 0005. 8898-8911 [doi]

MEEL: Multi-Modal Event Evolution LearningZhengwei Tao, Zhi Jin, Junqiang Huang, Xiancai Chen, Xiaoying Bai, Yifan Zhang, Chongyang Tao. 8912-8925 [doi]

LLM-REDIAL: A Large-Scale Dataset for Conversational Recommender Systems Created from User Behaviors with LLMsTingting Liang, Chenxin Jin, Lingzhi Wang, Wenqi Fan, Congying Xia, Kai Chen, Yuyu Yin. 8926-8939 [doi]

Investigating Subtler Biases in LLMs: Ageism, Beauty, Institutional, and Nationality Bias in Generative ModelsMahammed Kamruzzaman, Md. Minul Islam Shovon, Gene Louis Kim. 8940-8965 [doi]

EVIT: Event-Oriented Instruction Tuning for Event ReasoningZhengwei Tao, Xiancai Chen, Zhi Jin, Xiaoying Bai, Haiyan Zhao, Yiwei Lou. 8966-8979 [doi]

InstructCMP: Length Control in Sentence Compression through Instruction-based Large Language ModelsJuseon-Do, Hidetaka Kamigaito, Manabu Okumura, Jingun Kwon. 8980-8996 [doi]

SymTax: Symbiotic Relationship and Taxonomy Fusion for Effective Citation RecommendationKaran Goyal, Mayank Goel, Vikram Goyal, Mukesh K. Mohania. 8997-9008 [doi]

Assessing News Thumbnail Representativeness: Counterfactual text can enhance the cross-modal matching abilityYejun Yoon, Seunghyun Yoon 0002, Kunwoo Park. 9009-9024 [doi]

Towards Better Question Generation in QA-based Event ExtractionZijin Hong, Jian Liu. 9025-9038 [doi]

Budget-Constrained Tool Learning with PlanningYuanhang Zheng, Peng Li, Ming Yan, Ji Zhang, Fei Huang, Yang Liu. 9039-9052 [doi]

TextBind: Multi-turn Interleaved Multimodal Instruction-following in the WildHuayang Li, Siheng Li, Deng Cai 0002, Longyue Wang, Lemao Liu, Taro Watanabe, Yujiu Yang, Shuming Shi 0001. 9053-9076 [doi]

The Critique of CritiqueShichao Sun, Junlong Li, Weizhe Yuan, Ruifeng Yuan, Wenjie Li, Pengfei Liu. 9077-9096 [doi]

CoCo-Agent: A Comprehensive Cognitive MLLM Agent for Smartphone GUI AutomationXinbei Ma, Zhuosheng Zhang 0001, Hai Zhao 0001. 9097-9110 [doi]

FRVA: Fact-Retrieval and Verification Augmented Entailment Tree Generation for Explainable Question AnsweringYue Fan, Hu Zhang 0003, Ru Li 0001, Yujie Wang 0003, Hongye Tan, Jiye Liang. 9111-9128 [doi]

P4: Plug-and-Play Discrete Prompting for Large Language Models PersonalizationYuansen Zhang, Xiao Wang, Tianze Chen, Jiayi Fu, Tao Gui, Qi Zhang 0001. 9129-9144 [doi]

Large Language Models Can Learn Representation in Natural LanguageYiduo Guo, Yaobo Liang, Dongyan Zhao 0001, Nan Duan. 9145-9154 [doi]

CTC-based Non-autoregressive Textless Speech-to-Speech TranslationQingkai Fang, Zhengrui Ma, Yan Zhou, Min Zhang, Yang Feng. 9155-9161 [doi]

RRNorm: A Novel Framework for Chinese Disease Diagnoses Normalization via LLM-Driven Terminology Component Recognition and ReconstructionYongqi Fan, Yansha Zhu, Kui Xue, JingPing Liu, Tong Ruan. 9162-9175 [doi]

Unexpected Phenomenon: LLMs' Spurious Associations in Information ExtractionWeiyan Zhang, Wanpeng Lu, Jiacheng Wang, Yating Wang, Lihan Chen, Haiyun Jiang, JingPing Liu, Tong Ruan. 9176-9190 [doi]

AutoCAP: Towards Automatic Cross-lingual Alignment Planning for Zero-shot Chain-of-ThoughtYongheng Zhang, Qiguang Chen, Min Li 0007, Wanxiang Che, Libo Qin 0001. 9191-9200 [doi]

LCS: A Language Converter Strategy for Zero-Shot Neural Machine TranslationZengkui Sun, Yijin Liu, Fandong Meng, Jinan Xu, Yufeng Chen 0005, Jie Zhou 0016. 9201-9214 [doi]

Are LLMs Capable of Data-based Statistical and Causal Reasoning? Benchmarking Advanced Quantitative Reasoning with DataXiao Liu 0032, Zirui Wu, Xueqing Wu 0001, Pan Lu, Kai-Wei Chang, Yansong Feng. 9215-9235 [doi]

On the Vulnerability of Safety Alignment in Open-Access LLMsJingwei Yi, Rui Ye, Qisi Chen, Bin Zhu, Siheng Chen, Defu Lian, Guangzhong Sun, Xing Xie 0001, Fangzhao Wu. 9236-9260 [doi]

PEK: A Parameter-Efficient Framework for Knowledge-Grounded Dialogue GenerationPan Yang, Dandan Song, Zhijing Wu 0001, Yanru Zhou. 9261-9273 [doi]

Evidence Retrieval is almost All You Need for Fact VerificationLiwen Zheng, Chaozhuo Li 0001, Xi Zhang 0008, Yuming Shang, Feiran Huang, Haoran Jia. 9274-9281 [doi]

Outdated Issue Aware Decoding for Factual Knowledge EditingZengkui Sun, Yijin Liu, Jiaan Wang, Fandong Meng, Jinan Xu, Yufeng Chen 0005, Jie Zhou 0016. 9282-9293 [doi]

Disentangling Dialect from Social Bias via Multitask Learning to Improve FairnessMaximilian Spliethöver, Sai Nikhil Menon, Henning Wachsmuth. 9294-9313 [doi]

DP-MLM: Differentially Private Text Rewriting Using Masked Language ModelsStephen Meisenbacher, Maulik Chevli, Juraj Vladika, Florian Matthes. 9314-9328 [doi]

Question-Instructed Visual Descriptions for Zero-Shot Video AnsweringDavid Mogrovejo, Thamar Solorio. 9329-9339 [doi]

EX-FEVER: A Dataset for Multi-hop Explainable Fact VerificationHuanhuan Ma, Weizhi Xu 0002, Yifan Wei, Liuji Chen, Liang Wang, Qiang Liu 0006, Shu Wu. 9340-9353 [doi]

Agent-FLAN: Designing Data and Methods of Effective Agent Tuning for Large Language ModelsZehui Chen, Kuikun Liu, Qiuchen WANG, Wenwei Zhang, Jiangning Liu, Dahua Lin, Kai Chen 0026, Feng Zhao. 9354-9366 [doi]

Fact-Checking the Output of Large Language Models via Token-Level Uncertainty QuantificationEkaterina Fadeeva, Aleksandr Rubashevskii, Artem Shelmanov, Sergey Petrakov, Haonan Li 0002, Hamdy Mubarak, Evgenii Tsymbalov, Gleb Kuzmin, Alexander Panchenko, Timothy Baldwin, Preslav Nakov, Maxim Panov. 9367-9385 [doi]

Deciphering the Impact of Pretraining Data on Large Language Models through Machine UnlearningYang Zhao, Li Du, Xiao Ding, Kai Xiong 0002, Zhouhao Sun, Shi Jun, Ting Liu 0001, Bing Qi 0001n. 9386-9406 [doi]

Critical Learning Periods: Leveraging Early Training Dynamics for Efficient Data PruningEverlyn Chimoto, Jay Gala, Orevaoghene Ahia, Julia Kreutzer, Bruce A. Bassett, Sara Hooker. 9407-9426 [doi]

What Are You Token About? Differentiable Perturbed Top-k Token Selection for Scientific Document SummarizationLuca Ragazzi, Paolo Italiani, Gianluca Moro, Mattia Panni. 9427-9440 [doi]

Description Boosting for Zero-Shot Entity and Relation ClassificationGabriele Picco, Leopold Fuchs, Marcos Martínez Galindo, Alberto Purpura, Vanessa López, Hoang Thanh Lam. 9441-9457 [doi]

Domain-Aware k-Nearest-Neighbor Knowledge Distillation for Machine TranslationZhexuan Wang, Shudong Liu 0004, Xuebo Liu 0002, Miao Zhang, Derek F. Wong, Min Zhang 0005. 9458-9469 [doi]

Beyond Single-Event Extraction: Towards Efficient Document-Level Multi-Event Argument ExtractionWanlong Liu, Li Zhou, Dingyi Zeng, Yichen Xiao, Shaohuan Cheng, Chen Zhang, Grandee Lee, Malu Zhang, Wenyu Chen. 9470-9487 [doi]

Revisiting Interpolation Augmentation for Speech-to-Text GenerationChen Xu 0008, Jie Wang, Xiaoqian Liu, Qian Dong, Chunliang Zhang, Tong Xiao, Jingbo Zhu, Dapeng Man, Wu Yang 0001. 9488-9499 [doi]

Bootstrapping LLM-based Task-Oriented Dialogue Agents via Self-TalkDennis Ulmer, Elman Mansimov, Kaixiang Lin, Lijia Sun, Xibin Gao, Yi Zhang. 9500-9522 [doi]

Semantic are Beacons: A Semantic Perspective for Unveiling Parameter-Efficient Fine-Tuning in Knowledge LearningRenzhi Wang 0001, Piji Li. 9523-9537 [doi]

Leveraging Collection-Wide Similarities for Unsupervised Document Structure ExtractionGili Lior, Yoav Goldberg, Gabriel Stanovsky. 9538-9550 [doi]

Enhancing Cross Text-Molecule Learning by Self-AugmentationYinuo Jiang, Xiang Zhuang, Keyan Ding, Qiang Zhang, Huajun Chen. 9551-9565 [doi]

RePALM: Popular Quote Tweet Generation via Auto-Response AugmentationErxin Yu, Jing Li, Chunpu Xu. 9566-9579 [doi]

On the Effect of (Near) Duplicate Subwords in Language ModellingAnton Schäfer, Thomas Hofmann, Imanol Schlag, Tiago Pimentel. 9580-9597 [doi]

Do Pre-Trained Language Models Detect and Understand Semantic Underspecification? Ask the DUST!Frank Wildenburg, Michael Hanna 0001, Sandro Pezzelle. 9598-9613 [doi]

Visual Hallucinations of Multi-modal Large Language ModelsWen Huang, Hongbin Liu 0005, Minxin Guo, Neil Gong 0001. 9614-9631 [doi]

SumSurvey: An Abstractive Dataset of Scientific Survey Papers for Long Document SummarizationRan Liu, Ming Liu, Min Yu, He Zhang, Jianguo Jiang, Gang Li, Weiqing Huang. 9632-9651 [doi]

Pushing the Limits of Low-Resource NER Using LLM Artificial Data GenerationJoan Santoso, Patrick Sutanto, Billy Cahyadi, Esther Irawati Setiawan. 9652-9667 [doi]

Understanding and Patching Compositional Reasoning in LLMsZhaoyi Li, Gangwei Jiang, Hong Xie 0004, Linqi Song, Defu Lian, Ying Wei 0001. 9668-9688 [doi]

Bilingual Rhetorical Structure Parsing with Large Parallel AnnotationsElena Chistova. 9689-9706 [doi]

Book2Dial: Generating Teacher Student Interactions from Textbooks for Cost-Effective Development of Educational ChatbotsJunling Wang, Jakub Macina, Nico Daheim, Sankalan Pal Chowdhury, Mrinmaya Sachan. 9707-9731 [doi]

SELP: A Semantically-Driven Approach for Separated and Accurate Class Prototypes in Few-Shot Text ClassificationWenxin Liang, Tingyu Zhang, Han Liu 0008, Feng Zhang. 9732-9741 [doi]

Automated Focused Feedback Generation for Scientific Writing AssistanceEric Chamoun, Michael Schlichtkrull, Andreas Vlachos 0001. 9742-9763 [doi]

FastGAS: Fast Graph-based Annotation Selection for In-Context LearningZihan Chen, Song Wang, Cong Shen, Jundong Li. 9764-9780 [doi]

Pruning Large Language Models to Intra-module Low-rank Architecture with Transitional ActivationsBowen Shen, Zheng Lin 0001, Daren Zha, Wei Liu 0005, Jian Luan 0001, Bin Wang 0004, Weiping Wang 0005. 9781-9793 [doi]

Integrating Multi-scale Contextualized Information for Byte-based Neural Machine TranslationLanglin Huang, Yang Feng 0004. 9794-9801 [doi]

Deductive Closure Training of Language Models for Coherence, Accuracy, and UpdatabilityAfra Feyza Akyürek, Ekin Akyürek, Leshem Choshen, Derry Wijaya, Jacob Andreas. 9802-9818 [doi]

Self-Supervised Singing Voice Pre-Training towards Speech-to-Singing ConversionRuiqi Li, Rongjie Huang, Yongqi Wang, Zhiqing Hong, Zhou Zhao. 9819-9831 [doi]

Evaluating Large Language Model Biases in Persona-Steered GenerationAndy Liu, Mona Diab, Daniel Fried. 9832-9850 [doi]

Leveraging Entity Information for Cross-Modality Correlation Learning: The Entity-Guided Multimodal SummarizationYanghai Zhang, Ye Liu 0011, Shiwei Wu, Kai Zhang 0038, Xukai Liu, Qi Liu 0003, Enhong Chen. 9851-9862 [doi]

CR-UTP: Certified Robustness against Universal Text Perturbations on Large Language ModelsQian Lou, Xin Liang, Jiaqi Xue, Yancheng Zhang, Rui Xie, Mengxin Zheng. 9863-9875 [doi]

Recovering document annotations for sentence-level bitextRachel Wicks, Matt Post, Philipp Koehn. 9876-9890 [doi]

MetaPro 2.0: Computational Metaphor Processing on the Effectiveness of Anomalous Language ModelingRui Mao 0010, Kai He, Claudia Ong, Qian Liu 0012, Erik Cambria. 9891-9908 [doi]

Boosting LLM Agents with Recursive Contemplation for Effective Deception HandlingShenzhi Wang, Chang Liu, Zilong Zheng, Siyuan Qi, Shuo Chen, Qisen Yang, Andrew Zhao, Chaofei Wang, Shiji Song, Gao Huang 0001. 9909-9953 [doi]

Direct Preference Optimization with an OffsetAfra Amini, Tim Vieira, Ryan Cotterell. 9954-9972 [doi]

TransFace: Unit-Based Audio-Visual Speech Synthesizer for Talking Head TranslationXize Cheng, Rongjie Huang, Linjun Li, Zehan Wang 0001, Tao Jin, Aoxiong Yin, Feiyang Chen, Xinyu Duan, Baoxing Huai, Zhou Zhao. 9973-9986 [doi]

More than Minorities and Majorities: Understanding Multilateral Bias in Language GenerationJiaxu Zhao 0002, Zijing Shi, Yitong Li, Yulong Pei, Ling Chen 0006, Meng Fang, Mykola Pechenizkiy. 9987-10001 [doi]

Fair Federated Learning with Biased Vision-Language ModelsHuimin Zeng, Zhenrui Yue, Yang Zhang 0031, Lanyu Shang, Dong Wang 0002. 10002-10017 [doi]

SpeechGuard: Exploring the Adversarial Robustness of Multi-modal Large Language ModelsRaghuveer Peri, Sai Muralidhar Jayanthi, Srikanth Ronanki, Anshu Bhatia, Karel Mundnich, Saket Dingliwal, Nilaksh Das, Zejiang Hou, Goeric Huybrechts, Srikanth Vishnubhotla, Daniel Garcia-Romero, Sundararajan Srinivasan, Kyu J. Han, Katrin Kirchhoff. 10018-10035 [doi]

ACUEval: Fine-grained Hallucination Evaluation and Correction for Abstractive SummarizationDavid Wan, Koustuv Sinha, Srini Iyer 0001, Asli Celikyilmaz, Mohit Bansal, Ramakanth Pasunuru. 10036-10056 [doi]

An Empirical Study on Parameter-Efficient Fine-Tuning for MultiModal Large Language ModelsXiongtao Zhou, Jie He 0004, Yuhua Ke, Guangyao Zhu, Víctor Gutiérrez-Basulto, Jeff Z. Pan. 10057-10084 [doi]

PARADISE: Evaluating Implicit Planning Skills of Language Models with Procedural Warnings and Tips DatasetArda Uzunoglu, Gözde Gül Sahin, Abdulfattah Safa. 10085-10102 [doi]

TURNA: A Turkish Encoder-Decoder Language Model for Enhanced Understanding and GenerationGökçe Uludogan, Zeynep Yirmibesoglu Balal, Salih Furkan Akkurt, Meliksah Türker, Onur Güngör 0001, Susan Üsküdarli. 10103-10117 [doi]

MELD-ST: An Emotion-aware Speech Translation DatasetSirou Chen, Sakiko Yahata, Shuichiro Shimizu, Zhengdong Yang, Yihang Li, Chenhui Chu, Sadao Kurohashi. 10118-10126 [doi]

Designing Informative Metrics for Few-Shot Example SelectionRishabh Adiga, Lakshmi Subramanian, Varun Chandrasekaran. 10127-10135 [doi]

Chain-of-Quizzes: Pedagogy-inspired Example Selection in In-Context-LearningYiquan Wu, Anlai Zhou, Yuhang Liu, YiFei Liu, Adam Jatowt, Weiming Lu 0001, Jun Xiao 0001, Kun Kuang. 10136-10142 [doi]

It's Not Easy Being Wrong: Large Language Models Struggle with Process of Elimination ReasoningNishant Balepur, Shramay Palta, Rachel Rudinger. 10143-10166 [doi]

From Discrimination to Generation: Low-Resource Intent Detection with Language Model Instruction TuningFeng Zhang, Wei Chen, Fei Ding, Meng Gao, Tengjiao Wang, Jiahui Yao, Jiabin Zheng. 10167-10183 [doi]

Efficient Continual Pre-training for Building Domain Specific Large Language ModelsYong Xie, Karan Aggarwal, Aitzaz Ahmad. 10184-10201 [doi]

Distantly-Supervised Joint Extraction with Noise-Robust LearningYufei Li, Xiao Yu 0007, Yanghong Guo, Yanchi Liu, Haifeng Chen, Cong Liu 0005. 10202-10217 [doi]

LLM Factoscope: Uncovering LLMs' Factual Discernment through Measuring Inner StatesJinwen He, Yujia Gong, Zijin Lin, Cheng'an Wei, Yue Zhao 0018, Kai Chen 0012. 10218-10230 [doi]

DictLLM: Harnessing Key-Value Data Structures with Large Language Models for Enhanced Medical DiagnosticsYiqiu Guo, Yuchen Yang, Ya Zhang, Yu Wang, Yanfeng Wang. 10231-10241 [doi]

imapScore: Medical Fact Evaluation Made EasyHuimin Wang, Yutian Zhao, Xian Wu 0001, Yefeng Zheng 0001. 10242-10257 [doi]

Making Harmful Behaviors Unlearnable for Large Language ModelsXin Zhou 0012, Yi Lu, Ruotian Ma, Yujian Wei, Tao Gui, Qi Zhang 0001, Xuanjing Huang 0001. 10258-10273 [doi]

Debiasing Large Language Models with Structured KnowledgeCongda Ma, Tianyu Zhao, Manabu Okumura. 10274-10287 [doi]

Contrastive Instruction TuningTianyi Yan, Fei Wang 0060, James Y. Huang, Wenxuan Zhou, Fan Yin, Aram Galstyan, Wenpeng Yin 0001, Muhao Chen. 10288-10302 [doi]

Bootstrapped Pre-training with Dynamic Identifier Prediction for Generative RetrievalYubao Tang, Ruqing Zhang 0001, Jiafeng Guo, Maarten de Rijke, Yixing Fan, Xueqi Cheng. 10303-10317 [doi]

Refining and Synthesis: A Simple yet Effective Data Augmentation Framework for Cross-Domain Aspect-based Sentiment AnalysisHaining Wang, Kang He, Bobo Li, Lei Chen, Fei Li, Xu Han, Chong Teng, Donghong Ji. 10318-10329 [doi]

Codec-SUPERB: An In-Depth Analysis of Sound Codec ModelsHaibin Wu, Ho-Lam Chung, Yi-Cheng Lin, Yuan-Kuei Wu, Xuanjun Chen, Yu-Chi Pai, Hsiu-Hsuan Wang, Kai-Wei Chang, Alexander H. Liu, Hung-yi Lee. 10330-10348 [doi]

CACL: Community-Aware Heterogeneous Graph Contrastive Learning for Social Media Bot DetectionSirry Chen, Shuo Feng, Songsong Liang, Chen-Chen Zong, Jing Li, Piji Li. 10349-10360 [doi]

Are Machines Better at Complex Reasoning? Unveiling Human-Machine Inference Gaps in Entailment VerificationSoumya Sanyal 0001, Tianyi Xiao, Jiacheng Liu 0010, Wenya Wang, Xiang Ren 0001. 10361-10386 [doi]

ChartInstruct: Instruction Tuning for Chart Comprehension and ReasoningAhmed Masry, Mehrad Shahmohammadi, Md. Rizwan Parvez, Enamul Hoque, Shafiq Joty. 10387-10409 [doi]

Improving Multilingual Neural Machine Translation by Utilizing Semantic and Linguistic FeaturesMengyu Bu, Shuhao Gu, Yang Feng. 10410-10423 [doi]

Mixture-of-Supernets: Improving Weight-Sharing Supernet Training with Architecture-Routed Mixture-of-ExpertsGanesh Jawahar, Haichuan Yang, Yunyang Xiong, Zechun Liu, Dilin Wang, Fei Sun, Meng Li 0004, Aasish Pappu, Barlas Oguz, Muhammad Abdul-Mageed, Laks V. S. Lakshmanan, Raghuraman Krishnamoorthi, Vikas Chandra. 10424-10443 [doi]

SharedCon: Implicit Hate Speech Detection using Shared SemanticsHyeseon Ahn, Youngwook Kim, Jungin Kim, Yo-Sub Han. 10444-10455 [doi]

Smaller Language Models are capable of selecting Instruction-Tuning Training Data for Larger Language ModelsDheeraj Mekala, Alex Nguyen, Jingbo Shang. 10456-10470 [doi]

InjecAgent: Benchmarking Indirect Prompt Injections in Tool-Integrated Large Language Model AgentsQiusi Zhan, Zhixiang Liang, Zifan Ying, Daniel Kang. 10471-10506 [doi]

Generalization-Enhanced Code Vulnerability Detection via Multi-Task Instruction Fine-TuningXiaohu Du, Ming Wen 0001, Jiahao Zhu, Zifan Xie, bin Ji, Huijun Liu, Xuanhua Shi, Hai Jin 0001. 10507-10521 [doi]

PPTSER: A Plug-and-Play Tag-guided Method for Few-shot Semantic Entity Recognition on Visually-rich DocumentsWenhui Liao, Jiapeng Wang, Zening Lin, Longfei Xiong, Lianwen Jin. 10522-10539 [doi]

LLM Performance Predictors are good initializers for Architecture SearchGanesh Jawahar, Muhammad Abdul-Mageed, Laks V. S. Lakshmanan, Dujian Ding. 10540-10560 [doi]

MODDP: A Multi-modal Open-domain Chinese Dataset for Dialogue Discourse ParsingChen Gong 0004, Dexin Kong, Suxian Zhao, Xingyu Li, Guohong Fu. 10561-10573 [doi]

Chinese MentalBERT: Domain-Adaptive Pre-training on Social Media for Chinese Mental Health Text AnalysisWei Zhai, Hongzhi Qi, Qing Zhao 0005, Jianqiang Li 0002, Ziqi Wang, Han Wang, Bing Yang, Guanghui Fu. 10574-10585 [doi]

Beyond One-Preference-Fits-All Alignment: Multi-Objective Direct Preference OptimizationZhanhui Zhou, Jie Liu, Jing Shao, Xiangyu Yue 0001, Chao Yang 0026, Wanli Ouyang, Yu Qiao 0001. 10586-10613 [doi]

DORY: Deliberative Prompt Recovery for LLMLirong Gao, Ru Peng, Yiming Zhang, Junbo Zhao. 10614-10632 [doi]

STYLE: Improving Domain Transferability of Asking Clarification Questions in Large Language Model Powered Conversational AgentsYue Chen, Chen Huang, Yang Deng 0002, Wenqiang Lei, Dingnan Jin, Jia Liu, Tat-Seng Chua. 10633-10649 [doi]

Evaluating Robustness of Generative Search Engine on Adversarial Factoid QuestionsXuming Hu, Xiaochuan Li, Junzhe Chen, Yinghui Li, Yangning Li, Xiaoguang Li, Yasheng Wang, Qun Liu, Lijie Wen 0001, Philip S. Yu, Zhijiang Guo. 10650-10671 [doi]

Automatic Engineering of Long PromptsCho-Jui Hsieh, Si Si, Felix Yu, Inderjit S. Dhillon. 10672-10685 [doi]

AS-ES Learning: Towards efficient CoT learning in small modelsNuwa Xi, Yuhan Chen, Sendong Zhao, Haochun Wang, GongZhang GongZhang, Bing Qin 0001, Ting Liu 0001. 10686-10697 [doi]

II-MMR: Identifying and Improving Multi-modal Multi-hop Reasoning in Visual Question AnsweringJihyung Kil, Farideh Tavazoee, Dongyeop Kang, Joo-Kyung Kim. 10698-10709 [doi]

TAME-RD: Text Assisted Replication of Image Multi-Adjustments for Reverse DesigningPooja Guhan, Uttaran Bhattacharya, Somdeb Sarkhel, Vahid Azizi 0005, Xiang Chen, Saayan Mitra, Aniket Bera, Dinesh Manocha. 10710-10727 [doi]

Batch-ICL: Effective, Efficient, and Order-Agnostic In-Context LearningKaiyi Zhang, Ang Lv, Yuhan Chen, Hansen Ha, Tao Xu, Rui Yan. 10728-10739 [doi]

IndicVoices: Towards building an Inclusive Multilingual Speech Dataset for Indian LanguagesTahir Javed, Janki Nawale, Eldho Ittan George, Sakshi Joshi, Kaushal Santosh Bhogale, Deovrat Mehendale, Ishvinder Virender Sethi, Aparna Ananthanarayanan, Hafsah Faquih, Pratiti Palit, Sneha Ravishankar, Saranya Sukumaran, Tripura Panchagnula, Sunjay Murali, Kunal Sharad Gandhi, Ambujavalli R, Manickam K. M, C. Venkata Vaijayanthi, Krishnan Srinivasa Raghavan Karunganni, Pratyush Kumar, Mitesh M. Khapra. 10740-10782 [doi]

ViCor: Bridging Visual Understanding and Commonsense Reasoning with Large Language ModelsKaiwen Zhou, Kwonjoon Lee, Teruhisa Misu, Xin Wang 0061. 10783-10795 [doi]

Decomposition for Enhancing Attention: Improving LLM-based Text-to-SQL through Workflow ParadigmYuanzhen Xie, Xinzhou Jin, Tao Xie, Matrixmxlin Matrixmxlin, Liang Chen 0001, Chenyun Yu, Cheng Lei, Chengxiang Zhuo, Bo Hu, Zang Li. 10796-10816 [doi]

Unveiling Opinion Evolution via Prompting and Diffusion for Short Video Fake News DetectionLinlin Zong, Jiahui Zhou, Wenmin Lin, Xinyue Liu, Xianchao Zhang 0001, Bo Xu 0009. 10817-10826 [doi]

iSign: A Benchmark for Indian Sign Language ProcessingAbhinav Joshi, Romit Mohanty, Mounika Kanakanti, Andesha Mangla, Sudeep Choudhary, Monali Barbate, Ashutosh Modi. 10827-10844 [doi]

Data Contamination Calibration for Black-box LLMsWentao Ye, Jiaqi Hu, Liyao Li, Haobo Wang, Gang Chen 0001, Junbo Zhao 0002. 10845-10861 [doi]

Truth-Aware Context Selection: Mitigating Hallucinations of Large Language Models Being Misled by Untruthful ContextsTian Yu, Shaolei Zhang, Yang Feng 0004. 10862-10884 [doi]

Efficiently Exploring Large Language Models for Document-Level Machine Translation with In-context LearningMenglong Cui, Jiangcun Du, ShaoLin Zhu, Deyi Xiong. 10885-10897 [doi]

Improving Grammatical Error Correction via Contextual Data AugmentationYixuan Wang, Baoxin Wang, Yijun Liu, Qingfu Zhu, Dayong Wu, Wanxiang Che. 10898-10910 [doi]

RECOST: External Knowledge Guided Data-efficient Instruction TuningQi Zhang, Yiming Zhang, Haobo Wang, Junbo Zhao. 10911-10921 [doi]

Understanding Cross-Lingual Alignment - A SurveyKatharina Hämmerl, Jindrich Libovický, Alexander Fraser 0001. 10922-10943 [doi]

Mitigate Negative Transfer with Similarity Heuristic Lifelong Prompt TuningChenyuan Wu, Gangwei Jiang, Defu Lian. 10944-10959 [doi]

PANDA: Preference Adaptation for Enhancing Domain-Specific Abilities of LLMsAn Liu, Zonghan Yang, Zhenhe Zhang, Qingyuan Hu, Peng Li, Ming Yan, Ji Zhang, Fei Huang, Yang Liu. 10960-10977 [doi]

Developing PUGG for Polish: A Modern Approach to KBQA, MRC, and IR Dataset ConstructionAlbert Sawczyn, Katsiaryna Viarenich, Konrad Wojtasik, Aleksandra Domogala, Marcin Oleksy, Maciej Piasecki, Tomasz Kajdanowicz. 10978-10996 [doi]

Knowledge-to-SQL: Enhancing SQL Generation with Data Expert LLMZijin Hong, Zheng Yuan, Hao Chen 0062, Qinggang Zhang, Feiran Huang, Xiao Huang 0001. 10997-11008 [doi]

Centroid-Based Efficient Minimum Bayes Risk DecodingHiroyuki Deguchi, Yusuke Sakai 0010, Hidetaka Kamigaito, Taro Watanabe, Hideki Tanaka, Masao Utiyama. 11009-11018 [doi]

Enhancing Distractor Generation for Multiple-Choice Questions with Retrieval Augmented Pretraining and Knowledge Graph IntegrationHan-Cheng Yu, Yu-An Shih, Kin-Man Law, Kai-Yu Hsieh, Yu-Chen Cheng, Hsin-Chih Ho, Zih-An Lin, Wen-Chuan Hsu, Yao-Chung Fan. 11019-11029 [doi]

Exploiting Positional Bias for Query-Agnostic Generative Content in SearchAndrew Parry, Sean MacAvaney, Debasis Ganguly. 11030-11047 [doi]

ICC : Quantifying Image Caption Concreteness for Multimodal Dataset CurationMoran Yanuka, Morris Alper, Hadar Averbuch-Elor, Raja Giryes. 11048-11064 [doi]

On LLMs-Driven Synthetic Data Generation, Curation, and Evaluation: A SurveyLin Long, Rui Wang, Ruixuan Xiao, Junbo Zhao, Xiao Ding, Gang Chen, Haobo Wang. 11065-11082 [doi]

When is a Language Process a Language Model?Li Du, Holden Lee, Jason Eisner, Ryan Cotterell. 11083-11094 [doi]

Accelerating Multilingual Language Model for Excessively Tokenized LanguagesJimin Hong, Gibbeum Lee, Jaewoong Cho. 11095-11111 [doi]

Definition Generation for Automatically Induced Semantic FrameYi Han, Ryohei Sasano, Koichi Takeda 0003. 11112-11118 [doi]

Distillation Enhanced Generative RetrievalYongqi Li 0001, Zhen Zhang, Wenjie Wang 0007, Liqiang Nie, Wenjie Li 0002, Tat-Seng Chua. 11119-11129 [doi]

ToxVidLM: A Multimodal Framework for Toxicity Detection in Code-Mixed VideosKrishanu Maity, Poornash Sangeetha, Sriparna Saha 0001, Pushpak Bhattacharyya. 11130-11142 [doi]

StableToolBench: Towards Stable Large-Scale Benchmarking on Tool Learning of Large Language ModelsZhicheng Guo, Sijie Cheng, Hao Wang, Shihao Liang, Yujia Qin, Peng Li, Zhiyuan Liu, Maosong Sun 0001, Yang Liu. 11143-11156 [doi]

Both Matter: Enhancing the Emotional Intelligence of Large Language Models without Compromising the General IntelligenceWeixiang Zhao, Zhuojun Li, Shilong Wang, Yang Wang, Yulin Hu, Yanyan Zhao, Chen Wei, Bing Qin 0001. 11157-11176 [doi]

KorNAT: LLM Alignment Benchmark for Korean Social Values and Common KnowledgeJiyoung Lee, Minwoo Kim, Seungho Kim, Junghwan Kim, Seunghyun Won, Hwaran Lee, Edward Choi. 11177-11213 [doi]

Enhancing Adverse Drug Event Detection with Multimodal Dataset: Corpus Creation and Model DevelopmentPranab Sahoo, Ayush Kumar Singh, Sriparna Saha 0001, Aman Chadha, Samrat Mondal. 11214-11226 [doi]

Space Decomposition for Sentence EmbeddingWuttikorn Ponwitayarat, Peerat Limkonchotiwat, Ekapol Chuangsuwanich, Sarana Nutanong. 11227-11239 [doi]

Don't Augment, Rewrite? Assessing Abusive Language Detection with Synthetic DataCamilla Casula, Elisa Leonardelli, Sara Tonelli. 11240-11247 [doi]

Improving Low-Resource Machine Translation for Formosan Languages Using Bilingual Lexical ResourcesFrancis Zheng, Edison Marrese-Taylor, Yutaka Matsuo. 11248-11259 [doi]

CMMLU: Measuring massive multitask language understanding in ChineseHaonan Li 0002, Yixuan Zhang, Fajri Koto, Yifei Yang, Hai Zhao 0001, Yeyun Gong, Nan Duan, Timothy Baldwin. 11260-11285 [doi]

Prometheus-Vision: Vision-Language Model as a Judge for Fine-Grained EvaluationSeongyun Lee, Seungone Kim, Sue Hyun Park, Geewook Kim, Minjoon Seo. 11286-11315 [doi]

Evaluating Mathematical Reasoning of Large Language Models: A Focus on Error Identification and CorrectionXiaoyuan Li, Wenjie Wang 0007, Moxin Li, Junrong Guo, Yang Zhang 0072, Fuli Feng. 11316-11360 [doi]

Less is KEN: a Universal and Simple Non-Parametric Pruning Algorithm for Large Language ModelsMichele Mastromattei, Fabio Massimo Zanzotto. 11361-11374 [doi]

When Do LLMs Need Retrieval Augmentation? Mitigating LLMs' Overconfidence Helps Retrieval AugmentationShiyu Ni, Keping Bi, Jiafeng Guo, Xueqi Cheng. 11375-11388 [doi]

Hybrid Alignment Training for Large Language ModelsChenglong Wang, Hang Zhou, Kaiyan Chang, Bei Li, Yongyu Mu, Tong Xiao, Tongran Liu, Jingbo Zhu. 11389-11403 [doi]

Graph-Structured Speculative DecodingZhuocheng Gong, Jiahao Liu, Ziyue Wang, Pengfei Wu, Jingang Wang, Xunliang Cai, Dongyan Zhao 0001, Rui Yan 0001. 11404-11415 [doi]

Duwak: Dual Watermarks in Large Language ModelsChaoyi Zhu, Jeroen Galjaard, Pin-Yu Chen, Lydia Y. Chen. 11416-11436 [doi]

CodeAttack: Revealing Safety Generalization Challenges of Large Language Models via Code CompletionQibing Ren, Chang Gao, Jing Shao, Junchi Yan, Xin Tan, Wai Lam, Lizhuang Ma. 11437-11452 [doi]

Mitigating Reversal Curse in Large Language Models via Semantic-aware Permutation TrainingQingyan Guo, Rui Wang 0028, Junliang Guo, Xu Tan 0003, Jiang Bian 0002, Yujiu Yang. 11453-11464 [doi]

wav2vec-S: Adapting Pre-trained Speech Models for StreamingBiao Fu, Kai Fan 0002, Minpeng Liao, Yidong Chen 0001, Xiaodong Shi, Zhongqiang Huang. 11465-11480 [doi]

Peering into the Mind of Language Models: An Approach for Attribution in Contextual Question AnsweringAnirudh Phukan, Shwetha Somasundaram, Apoorv Saxena, Koustava Goswami, Balaji Vasan Srinivasan. 11481-11495 [doi]

TRAP: Targeted Random Adversarial Prompt Honeypot for Black-Box IdentificationMartin Gubri, Dennis Ulmer, Hwaran Lee, Sangdoo Yun, Seong Joon Oh. 11496-11517 [doi]

CLASP: Cross-modal Alignment Using Pre-trained Unimodal ModelsJianing Zhou, Ziheng Zeng, Hongyu Gong, Suma Bhat. 11518-11531 [doi]

TimeToM: Temporal Space is the Key to Unlocking the Door of Large Language Models' Theory-of-MindGuiyang Hou, Wenqi Zhang, Yongliang Shen 0001, Linjuan Wu, Weiming Lu 0001. 11532-11547 [doi]

Identifying and Mitigating Annotation Bias in Natural Language Understanding using Causal Mediation AnalysisSitiporn Sae Lim, Can Udomcharoenchaikit, Peerat Limkonchotiwat, Ekapol Chuangsuwanich, Sarana Nutanong. 11548-11563 [doi]

Perturbed examples reveal invariances shared by language modelsRuchit Rawal, Mariya Toneva. 11564-11584 [doi]

Dynamic Stochastic Decoding Strategy for Open-Domain Dialogue GenerationYiwei Li, Fei Mi, Yitong Li, Yasheng Wang, Bin Sun 0004, Shaoxiong Feng, Kan Li 0001. 11585-11596 [doi]

Discourse Structure-Aware Prefix for Generation-Based End-to-End Argumentation MiningYang Sun, Guanrong Chen, Caihua Yang, Jianzhu Bao, Bin Liang, Xi Zeng, Min Yang 0007, Ruifeng Xu. 11597-11613 [doi]

Poor-Supervised Evaluation for SuperLLM via Mutual ConsistencyPeiwen Yuan, Shaoxiong Feng, Yiwei Li, Xinglin Wang, Boyuan Pan, Heda Wang, Yao Hu, Kan Li 0001. 11614-11627 [doi]

Addressing Entity Translation Problem via Translation Difficulty and Context DiversityTian Liang, Xing Wang 0007, Mingming Yang, Yujiu Yang, Shuming Shi 0001, Zhaopeng Tu. 11628-11638 [doi]

ADAM: Dense Retrieval Distillation with Adaptive Dark ExamplesChongyang Tao, Chang Liu, Tao Shen 0001, Can Xu, Xiubo Geng, Binxing Jiao, Daxin Jiang. 11639-11651 [doi]

Instruction Position Matters in Sequence Generation with Large Language ModelsYijin Liu, Xianfeng Zeng, Chenze Shao, Fandong Meng, Jie Zhou 0016. 11652-11663 [doi]

XMoE: Sparse Models with Fine-grained and Adaptive Expert SelectionYuanhang Yang, Shiyi Qi, Wenchao Gu, Chaozheng Wang, Cuiyun Gao, Zenglin Xu. 11664-11674 [doi]

BranchNorm: Robustly Scaling Extremely Deep TransformersYijin Liu, Xianfeng Zeng, Fandong Meng, Jie Zhou. 11675-11687 [doi]

MusTQ: A Temporal Knowledge Graph Question Answering Dataset for Multi-Step Temporal ReasoningTingyi Zhang, Jiaan Wang, Zhixu Li, Jianfeng Qu, An Liu 0002, Zhigang Chen 0003, Hongping Zhi. 11688-11699 [doi]

Deal, or no deal (or who knows)? Forecasting Uncertainty in Conversations using Large Language ModelsAnthony Sicilia, Hyunwoo Kim 0002, Khyathi Raghavi Chandu, Malihe Alikhani, Jack Hessel. 11700-11726 [doi]

Knowledge Fusion By Evolving Weights of Language ModelsGuodong Du 0002, Jing Li, Hanting Liu, Runhua Jiang, Shuyang Yu, Yifei Guo, Sim Kuan Goh, Ho-Kin Tang. 11727-11742 [doi]

ScaLearn: Simple and Highly Parameter-Efficient Task Transfer by Learning to ScaleMarkus Frohmann, Carolin Holtermann, Shahed Masoudian, Anne Lauscher, Navid Rekabsaz. 11743-11776 [doi]

Visualizing Dialogues: Enhancing Image Selection through Dialogue Understanding with Large Language ModelsChang-Sheng Kao, Yun-Nung Chen. 11777-11788 [doi]

MatPlotAgent: Method and Evaluation for LLM-Based Agentic Scientific Data VisualizationZhiyu Yang, Zihan Zhou, Shuo Wang, Xin Cong, Xu Han, Yukun Yan, Zhenghao Liu, Zhixing Tan, Pengyuan Liu, Dong Yu, Zhiyuan Liu, Xiaodong Shi, Maosong Sun 0001. 11789-11804 [doi]

Continual Few-shot Relation Extraction via Adaptive Gradient Correction and Knowledge DecompositionJianpeng Hu, Chengxiang Tan, Jiacheng Xu, Xiangyun Kong. 11805-11816 [doi]

CMoralEval: A Moral Evaluation Benchmark for Chinese Large Language ModelsLinhao Yu, Yongqi Leng, Yufei Huang 0005, Shang Wu, Haixin Liu, Xinmeng Ji, Jiahui Zhao, Jinwang Song, Tingting Cui, Xiaoqing Cheng, Liutao Liutao, Deyi Xiong. 11817-11837 [doi]

Cache & Distil: Optimising API Calls to Large Language ModelsGuillem Ramírez, Matthias Lindemann, Alexandra Birch, Ivan Titov. 11838-11853 [doi]

Investigating the Impact of Model Instability on Explanations and UncertaintySara Marjanovic, Isabelle Augenstein, Christina Lioma. 11854-11879 [doi]

A Two-Stage Adaptation of Large Language Models for Text RankingLonghui Zhang, Yanzhao Zhang, Dingkun Long, Pengjun Xie, Meishan Zhang, Min Zhang 0005. 11880-11891 [doi]

Fine-tuning with HED-IT: The impact of human post-editing for dialogical language modelsDaniela Occhipinti, Michele Marchi, Irene Mondella, Huiyuan Lai, Felice dell'Orletta, Malvina Nissim, Marco Guerini. 11892-11907 [doi]

Analyze, Generate and Refine: Query Expansion with LLMs for Zero-Shot Open-Domain QAXinran Chen, Xuanang Chen, Ben He, Tengfei Wen, Le Sun 0001. 11908-11922 [doi]

On the Evaluation of Speech Foundation Models for Spoken Language UnderstandingSiddhant Arora, Ankita Pasad, Chung-Ming Chien, Jionghao Han, Roshan S. Sharma, Jee-weon Jung, Hira Dhamyal, William Chen, Suwon Shon, Hung-yi Lee, Karen Livescu, Shinji Watanabe 0001. 11923-11938 [doi]

Towards Multiple References Era - Addressing Data Leakage and Limited Reference Diversity in Machine Translation EvaluationXianfeng Zeng, Yijin Liu, Fandong Meng, Jie Zhou. 11939-11951 [doi]

Prompting open-source and commercial language models for grammatical error correction of English learner textChristopher Davis, Andrew Caines, Øistein E. Andersen, Shiva Taslimipoor, Helen Yannakoudakis, Zheng Yuan 0003, Christopher Bryant 0001, Marek Rei, Paula Buttery. 11952-11967 [doi]

BATS: BenchmArking Text Simplicity �Christin Kreutz, Fabian Haak, Björn Engelmann 0002, Philipp Schaer. 11968-11989 [doi]

AustroTox: A Dataset for Target-Based Austrian German Offensive Language DetectionPia Pachinger, Janis Goldzycher, Anna Maria Planitzer, Wojciech Kusa, Allan Hanbury, Julia Neidhardt. 11990-12001 [doi]

Discovering influential text using convolutional neural networksMegan Ayers, Luke Sanford, Margaret E. Roberts, Eddie Yang. 12002-12027 [doi]

LC4EE: LLMs as Good Corrector for Event ExtractionMengna Zhu, Kaisheng Zeng, Jibing Wu, Lihua Liu, Hongbin Huang, Lei Hou 0001, Juanzi Li. 12028-12038 [doi]

Generalization or Memorization: Data Contamination and Trustworthy Evaluation for Large Language ModelsYihong Dong, Xue Jiang, Huanyu Liu, Zhi Jin, Bin Gu, Mengfei Yang, Ge Li. 12039-12050 [doi]

Efficient Training of Language Models with Compact and Consistent Next Token DistributionsAshutosh Sathe, Sunita Sarawagi. 12051-12064 [doi]

Ancient Chinese Glyph Identification Powered by Radical SemanticsYang Chi, Fausto Giunchiglia, Chuntao Li, Hao Xu. 12065-12074 [doi]

PUB: A Pragmatics Understanding Benchmark for Assessing LLMs' Pragmatics CapabilitiesSettaluri Lakshmi Sravanthi, Meet Doshi, Pavan Tankala, V. Rudra Murthy, Raj Dabre, Pushpak Bhattacharyya. 12075-12097 [doi]

EmoTransKG: An Innovative Emotion Knowledge Graph to Reveal Emotion TransformationHuan Zhao, Xupeng Zha, Zixing Zhang 0001. 12098-12110 [doi]

How Vocabulary Sharing Facilitates Multilingualism in LLaMA?Fei Yuan, Shuai Yuan, Zhiyong Wu, Lei Li. 12111-12130 [doi]

Prefix Text as a Yarn: Eliciting Non-English Alignment in Foundation Language ModelRunzhe Zhan, Xinyi Yang, Derek F. Wong, Lidia S. Chao, Yue Zhang 0004. 12131-12145 [doi]

Dual Prompt Tuning based Contrastive Learning for Hierarchical Text ClassificationSishi Xiong, Yu Zhao, Jie Zhang, Mengxiang Li, Zhongjiang He, Xuelong Li, Shuangyong Song. 12146-12158 [doi]

Probing the Emergence of Cross-lingual Alignment during LLM TrainingHetong Wang, Pasquale Minervini, Edoardo M. Ponti. 12159-12173 [doi]

STSPL-SSC: Semi-Supervised Few-Shot Short Text Clustering with Semantic text similarity Optimized Pseudo-LabelsWenhua Nie, Lin Deng, Chang-bo Liu, Jialing Wei, Ruitong Han, Haoran Zheng. 12174-12185 [doi]

A Comprehensive Evaluation of Quantization Strategies for Large Language ModelsRenren Jin, Jiangcun Du, Wuwei Huang, Wei Liu, Jian Luan 0001, Bin Wang, Deyi Xiong. 12186-12215 [doi]

Exploiting Target Language Data for Neural Machine Translation Beyond Back TranslationAbudurexiti Reheman, Yingfeng Luo, Junhao Ruan, Chunliang Zhang, Anxiang Ma, Tong Xiao, Jingbo Zhu. 12216-12228 [doi]

Bayesian Prompt Ensembles: Model Uncertainty Estimation for Black-Box Large Language ModelsFrancesco Tonolini, Nikolaos Aletras, Jordan Massiah, Gabriella Kazai. 12229-12272 [doi]

X-ACE: Explainable and Multi-factor Audio Captioning EvaluationQian Wang, Jia-Chen Gu, Zhen-Hua Ling. 12273-12287 [doi]

Reasons to Reject? Aligning Language Models with JudgmentsWeiwen Xu, Deng Cai 0002, Zhisong Zhang, Wai Lam, Shuming Shi 0001. 12288-12304 [doi]

Decomposing Argumentative Essay Generation via Dialectical Planning of Complex ReasoningYuhang He, Jianzhu Bao, Yang Sun, Bin Liang, Min Yang 0007, Bing Qin 0001, Ruifeng Xu. 12305-12322 [doi]

Large Language Models are Few-Shot Training Example Generators: A Case Study in Fallacy RecognitionTariq Alhindi, Smaranda Muresan, Preslav Nakov. 12323-12334 [doi]

Concept-aware Data Construction Improves In-context Learning of Language ModelsMichal Stefánik, Marek Kadlcík, Petr Sojka. 12335-12352 [doi]

Beyond Text: Leveraging Multi-Task Learning and Cognitive Appraisal Theory for Post-Purchase Intention AnalysisGerard Yeo, Shaz Furniturewala, Kokil Jaidka. 12353-12360 [doi]

Non-Autoregressive Machine Translation as Constrained HMMHaoran Li, Zhanming Jie, Wei Lu. 12361-12372 [doi]

Multi-modal Stance Detection: New Datasets and ModelBin Liang, Ang Li, Jingqian Zhao, Lin Gui 0003, Min Yang, Yue Yu, Kam-Fai Wong, Ruifeng Xu. 12373-12387 [doi]

Enhanced Language Model Truthfulness with Learnable Intervention and Uncertainty ExpressionFarima Fatahi Bayat, Xin Liu, H. Jagadish, Lu Wang 0008. 12388-12400 [doi]

MM-LLMs: Recent Advances in MultiModal Large Language ModelsDuzhen Zhang, Yahan Yu, Jiahua Dong 0001, Chenxing Li, Dan Su 0002, Chenhui Chu, Dong Yu 0001. 12401-12430 [doi]

CIF-Bench: A Chinese Instruction-Following Benchmark for Evaluating the Generalizability of Large Language ModelsYizhi Li, Ge Zhang, Xingwei Qu, Jiali Li, Zhaoqun Li, Noah Wang, Hao Li, Ruibin Yuan, Yinghao Ma, Kai Zhang, Wangchunshu Zhou, Yiming Liang, Lei Zhang, Lei Ma, Jiajun Zhang, Zuowen Li, Wenhao Huang, Chenghua Lin, Jie Fu. 12431-12446 [doi]

Countering Reward Over-Optimization in LLM with Demonstration-Guided Reinforcement LearningMathieu Rita, Florian Strub, Rahma Chaabouni 0001, Paul Michel, Emmanuel Dupoux, Olivier Pietquin. 12447-12472 [doi]

Enhancing Idiomatic Representation in Multiple Languages via an Adaptive Contrastive Triplet LossWei He, Marco Idiart, Carolina Scarton, Aline Villavicencio. 12473-12485 [doi]

AdaLomo: Low-memory Optimization with Adaptive Learning RateKai Lv, Hang Yan 0001, Qipeng Guo, Haijun Lv, Xipeng Qiu. 12486-12502 [doi]

Propagation and Pitfalls: Reasoning-based Assessment of Knowledge Editing through Counterfactual TasksWenyue Hua, Jiang Guo, Mingwen Dong, Henghui Zhu, Patrick Ng, Zhiguo Wang. 12503-12525 [doi]

Exciting Mood Changes: A Time-aware Hierarchical Transformer for Change Detection ModellingAnthony Hills, Talia Tseriotou, Xenia Miscouridou, Adam Tsakalidis, Maria Liakata. 12526-12537 [doi]

CorNav: Autonomous Agent with Self-Corrected Planning for Zero-Shot Vision-and-Language NavigationXiwen Liang, Liang Ma, Shanshan Guo 0001, Jianhua Han, Hang Xu, Shikui Ma, Xiaodan Liang. 12538-12559 [doi]

SciMMIR: Benchmarking Scientific Multi-modal Information RetrievalSiwei Wu, Yizhi Li, Kang Zhu, Ge Zhang, Yiming Liang, Kaijing Ma, Chenghao Xiao, Haoran Zhang, Bohao Yang, Wenhu Chen, Wenhao Huang, Noura Al Moubayed, Jie Fu, Chenghua Lin. 12560-12574 [doi]

Diving Deep into the Motion Representation of Video-Text ModelsChinmaya Devaraj, Cornelia Fermüller, Yiannis Aloimonos. 12575-12584 [doi]

Learning to Generate Instruction Tuning Datasets for Zero-Shot Task AdaptationNihal V. Nayak, Yiyang Nan, Avi Trost, Stephen H. Bach. 12585-12611 [doi]

Demonstrations Are All You Need: Advancing Offensive Content Paraphrasing using In-Context LearningAnirudh Som, Karan Sikka, Helen Gent, Ajay Divakaran, Andreas Kathol, Dimitra Vergyri. 12612-12627 [doi]

Paying Attention to Deflections: Mining Pragmatic Nuances for Whataboutism Detection in Online DiscourseKhiem Phi, Noushin Salek Faramarzi, Chenlu Wang, Ritwik Banerjee. 12628-12643 [doi]

Epistemology of Language Models: Do Language Models Have Holistic Knowledge?Minsu Kim, James Thorne. 12644-12669 [doi]

Strong hallucinations from negation and how to fix themSwarnadeep Bhar, Nicholas Asher. 12670-12687 [doi]

LLMs as Narcissistic Evaluators: When Ego Inflates Evaluation ScoresYiqi Liu, Nafise Sadat Moosavi, Chenghua Lin. 12688-12701 [doi]

HelloFresh: LLM Evalutions on Streams of Real-World Human Editorial Actions across X Community Notes and Wikipedia editsTim Franzmeyer, Aleksandar Shtedritski, Samuel Albanie, Philip Torr 0001, João F. Henriques, Jakob N. Foerster. 12702-12716 [doi]

Chaos with Keywords: Exposing Large Language Models Sycophancy to Misleading Keywords and Evaluating Defense StrategiesAswin RRV, Nemika Tyagi, Md Nayem Uddin, Neeraj Varshney, Chitta Baral. 12717-12733 [doi]

Empowering Large Language Models for Textual Data AugmentationYichuan Li 0001, Kaize Ding, Jianling Wang, Kyumin Lee. 12734-12751 [doi]

Choose Your Transformer: Improved Transferability Estimation of Transformer Models on Classification TasksLukas Garbaciauskas, Max Ploner, Alan Akbik. 12752-12768 [doi]

Argument-Aware Approach To Event LinkingI-Hung Hsu, Zihan Xue, Nilay Pochhi, Sahil Bansal, Prem Natarajan, Jayanth Srinivasa, Nanyun Peng. 12769-12781 [doi]

CaLM: Contrasting Large and Small Language Models to Verify Grounded GenerationI-Hung Hsu, Zifeng Wang 0002, Long T. Le, Lesly Miculicich, Nanyun Peng, Chen-Yu Lee, Tomas Pfister. 12782-12803 [doi]

TextEE: Benchmark, Reevaluation, Reflections, and Future Challenges in Event ExtractionKuan-Hao Huang, I-Hung Hsu, Tanmay Parekh, Zhiyu Xie 0001, Zixuan Zhang, Prem Natarajan, Kai-Wei Chang, Nanyun Peng, Heng Ji. 12804-12825 [doi]

Understanding the Impacts of Language Technologies' Performance Disparities on African American Language SpeakersJay Cunningham, Su Lin Blodgett, Michael Madaio, Hal Daumé III, Christina Harrington, Hanna M. Wallach. 12826-12833 [doi]

OpenCodeInterpreter: Integrating Code Generation with Execution and RefinementTianyu Zheng, Ge Zhang, Tianhao Shen, Xueling Liu, Bill Yuchen Lin, Jie Fu, Wenhu Chen, Xiang Yue. 12834-12859 [doi]

Measuring and Addressing Indexical Bias in Information RetrievalCaleb Ziems, William Held, Jane Dwivedi-Yu, Diyi Yang. 12860-12877 [doi]

CIDAR: Culturally Relevant Instruction Dataset For ArabicZaid Alyafeai, Khalid Almubarak, Ahmed Ashraf, Deema Alnuhait, Saied Alshahrani, Gubran A. Q. Abdulrahman, Gamil Ahmed, Qais Gawah, Zead Saleh, Mustafa Ghaleb, Yousef Ali, Maged S. Al-Shaibani. 12878-12901 [doi]

RadGraph-XL: A Large-Scale Expert-Annotated Dataset for Entity and Relation Extraction from Radiology ReportsJean-Benoit Delbrouck, Pierre J. Chambon, Zhihong Chen, Maya Varma, Andrew Johnston, Louis Blankemeier, Dave Van Veen, Tan Bui, Steven Quoc Hung Truong, Curtis P. Langlotz. 12902-12915 [doi]

SMART: Submodular Data Mixture Strategy for Instruction TuningH. S. V. N. S. Kowndinya Renduchintala, Sumit Bhatia, Ganesh Ramakrishnan. 12916-12934 [doi]

Selective "Selective Prediction": Reducing Unnecessary Abstention in Vision-Language ReasoningTejas Srinivasan, Jack Hessel, Tanmay Gupta, Bill Yuchen Lin, Yejin Choi 0001, Jesse Thomason, Khyathi Chandu. 12935-12948 [doi]

Language Model Priors and Data Augmentation Strategies for Low-resource Machine Translation: A Case Study Using Finnish to Northern SámiJonne Sälevä, Constantine Lignos. 12949-12956 [doi]

Differentially Private Knowledge Distillation via Synthetic Text GenerationJames Flemings, Murali Annavaram. 12957-12968 [doi]

KIWI: A Dataset of Knowledge-Intensive Writing Instructions for Answering Research QuestionsFangyuan Xu, Kyle Lo, Luca Soldaini, Bailey Kuehl, Eunsol Choi, David Wadden. 12969-12990 [doi]

XL-HeadTags: Leveraging Multimodal Retrieval Augmentation for the Multilingual Generation of News Headlines and TagsFaisal Tareque Shohan, Mir Tafseer Nayeem, Samsul Islam, Abu Ubaida Akash, Shafiq Joty. 12991-13024 [doi]

InFoBench: Evaluating Instruction Following Ability in Large Language ModelsYiwei Qin, Kaiqiang Song, Yebowen Hu, Wenlin Yao, Sangwoo Cho, Xiaoyang Wang, Xuansheng Wu, Fei Liu 0004, Pengfei Liu 0003, Dong Yu. 13025-13048 [doi]

EcoRank: Budget-Constrained Text Re-ranking Using Large Language ModelsMuhammad Shihab Rashid, Jannat Ara Meem, Yue Dong, Vagelis Hristidis. 13049-13063 [doi]

FinTral: A Family of GPT-4 Level Multimodal Financial Large Language ModelsGagan Bhatia, El Moatez Billah Nagoudi, Hasan Cavusoglu, Muhammad Abdul-Mageed. 13064-13087 [doi]

Aligning Large Multimodal Models with Factually Augmented RLHFZhiqing Sun, Sheng Shen, Shengcao Cao, Haotian Liu, Chunyuan Li, Yikang Shen, Chuang Gan, Liangyan Gui, Yu-Xiong Wang, Yiming Yang, Kurt Keutzer, Trevor Darrell. 13088-13110 [doi]

The Art of Defending: A Systematic Evaluation and Analysis of LLM Defense Strategies on Safety and Over-DefensivenessNeeraj Varshney, Pavel Dolin, Agastya Seth, Chitta Baral. 13111-13128 [doi]

PAT-Questions: A Self-Updating Benchmark for Present-Anchored Temporal Question-AnsweringJannat Ara Meem, Muhammad Shihab Rashid, Yue Dong, Vagelis Hristidis. 13129-13148 [doi]

360°REA: Towards A Reusable Experience Accumulation with 360° Assessment for Multi-Agent SystemShen Gao, Hao Li, Zhengliang Shi, Chengrui Huang, Quan Tu, Shuo Shang, Zhiliang Tian, Minlie Huang. 13149-13162 [doi]

Extracting Polymer Nanocomposite Samples from Full-Length DocumentsGhazal Khalighinejad, Defne Circi, L. Catherine Brinson, Bhuwan Dhingra. 13163-13175 [doi]

Leveraging LLM Reasoning Enhances Personalized Recommender SystemsAlicia Tsai, Adam Kraft, Long Jin, Chenwei Cai, Anahita Hosseini, Taibai Xu, Zemin Zhang, Lichan Hong, Ed Huai-hsin Chi, Xinyang Yi. 13176-13188 [doi]

Toucan: Many-to-Many Translation for 150 African Language PairsAbdelRahim A. Elmadany, Ife Adebara, Muhammad Abdul-Mageed. 13189-13206 [doi]

Few-shot Dialogue Strategy Learning for Motivational Interviewing via Inductive ReasoningZhouhang Xie, Bodhisattwa Prasad Majumder, Mengjie Zhao, Yoshinori Maeda, Keiichi Yamada, Hiromi Wakaki, Julian J. McAuley. 13207-13219 [doi]

Evaluating Structural Generalization in Neural Machine TranslationRyoma Kumon, Daiki Matsuoka, Hitomi Yanaka. 13220-13239 [doi]

Figuratively Speaking: Authorship Attribution via Multi-Task Figurative Language ModelingGregorios A. Katsios, Ning Sa, Tomek Strzalkowski. 13240-13255 [doi]

CHAMP: A Competition-level Dataset for Fine-Grained Analyses of LLMs' Mathematical Reasoning CapabilitiesYujun Mao, Yoon Kim, Yilun Zhou. 13256-13274 [doi]

Improving Machine Translation with Large Language Models: A Preliminary Study with Cooperative DecodingJiali Zeng, Fandong Meng, Yongjing Yin, Jie Zhou. 13275-13288 [doi]

Integrating Pre-Trained Speech and Language Models for End-to-End Speech RecognitionYukiya Hono, Koh Mitsuda, Tianyu Zhao, Kentaro Mitsui, Toshiaki Wakatsuki, Kei Sawada. 13289-13305 [doi]

Proving membership in LLM pretraining data via data watermarksJohnny Tian-Zheng Wei, Ryan Yixiang Wang, Robin Jia. 13306-13320 [doi]

Enhancing Hallucination Detection through Perturbation-Based Synthetic Data Generation in System ResponsesDongxu Zhang, Varun Gangal, Barrett Martin Lattimer, Yi Yang. 13321-13332 [doi]

SecFormer: Fast and Accurate Privacy-Preserving Inference for Transformer Models via SMPCJinglong Luo, Yehong Zhang, Zhuo Zhang, Jiaqi Zhang, Xin Mu, Hui Wang, Yue Yu 0001, Zenglin Xu. 13333-13348 [doi]

Raccoon: Prompt Extraction Benchmark of LLM-Integrated ApplicationsJunlin Wang, Tianyi Yang, Roy Xie, Bhuwan Dhingra. 13349-13365 [doi]

History-Aware Conversational Dense RetrievalFengran Mo, Chen Qu 0001, Kelong Mao, Tianyu Zhu, Zhan Su, Kaiyu Huang, Jian-Yun Nie. 13366-13378 [doi]

Light Up the Shadows: Enhance Long-Tailed Entity Grounding with Concept-Guided Vision-Language ModelsYikai Zhang, Qianyu He, Xintao Wang, Siyu Yuan, Jiaqing Liang, Yanghua Xiao. 13379-13389 [doi]

ZeroStance: Leveraging ChatGPT for Open-Domain Stance Detection via Dataset GenerationChenye Zhao, Yingjie Li, Cornelia Caragea, Yue Zhang. 13390-13405 [doi]

Boosting Zero-Shot Crosslingual Performance using LLM-Based Augmentations with Effective Data SelectionBarah Fazili, Ashish Agrawal, Preethi Jyothi. 13406-13422 [doi]

Reinforcement Tuning for Detecting Stances and Debunking Rumors Jointly with Large Language ModelsRuichao Yang, Wei Gao, Jing Ma, Hongzhan Lin 0001, Bo Wang. 13423-13439 [doi]

Exploring the Potential of Dense Information in Multimodal AlignmentZhiyuan Fan, Zhihong Chen, Benyou Wang. 13440-13451 [doi]

Referral Augmentation for Zero-Shot Information RetrievalMichael Tang, Shunyu Yao, John Yang, Karthik Narasimhan. 13452-13461 [doi]

InstructEval: Instruction-Tuned Text Evaluator from Human PreferenceWenhao Wu, Wei Li 0176, Xinyan Xiao, Jiachen Liu, Sujian Li. 13462-13474 [doi]

A Curious Case of Searching for the Correlation between Training Data and Adversarial Robustness of Transformer Textual ModelsCuong Dang, Dung D. Le, Thai Le. 13475-13491 [doi]

InstructGraph: Boosting Large Language Models via Graph-centric Instruction Tuning and Preference AlignmentJianing Wang, Junda Wu, Yupeng Hou, Yao Liu 0017, Ming Gao 0001, Julian J. McAuley. 13492-13510 [doi]

RaDA: Retrieval-augmented Web Agent Planning with LLMsMinsoo Kim, Victor S. Bursztyn, Eunyee Koh, Shunan Guo, Seung-won Hwang. 13511-13525 [doi]

Competition-Level Problems are Effective LLM EvaluatorsYiming Huang, Zhenghao Lin, Xiao Liu 0029, Yeyun Gong, Shuai Lu, Fangyu Lei, Yaobo Liang, Yelong Shen, Chen Lin 0001, Nan Duan, Weizhu Chen. 13526-13544 [doi]

Large Language Models for Automated Open-domain Scientific Hypotheses DiscoveryZonglin Yang, Xinya Du, Junxian Li, Jie Zheng, Soujanya Poria, Erik Cambria. 13545-13565 [doi]

GRADUAL: Granularity-aware Dual Prototype Learning for Better Few-Shot Relation ExtractionZhiming Li, Yuchen Lyu. 13566-13577 [doi]

Training a Better Chinese Spelling Correction Model via Prior-knowledge Guided TeacherChi Wei, Shaobin Huang, Rongsheng Li, Naiyu Yan, Rui Wang. 13578-13589 [doi]

The Revolution of Multimodal Large Language Models: A SurveyDavide Caffagni, Federico Cocchi, Luca Barsellotti, Nicholas Moratelli, Sara Sarto, Lorenzo Baraldi 0001, Marcella Cornia, Rita Cucchiara. 13590-13618 [doi]

OOP: Object-Oriented Programming Evaluation Benchmark for Large Language ModelsShuai Wang, Liang Ding 0006, Li Shen 0008, Yong Luo 0008, Bo Du 0001, Dacheng Tao. 13619-13639 [doi]

Code Needs Comments: Enhancing Code LLMs with Comment AugmentationDemin Song, Honglin Guo, Yunhua Zhou, Shuhao Xing, Yudong Wang, Zifan Song, Wenwei Zhang, Qipeng Guo, Hang Yan 0001, Xipeng Qiu, Dahua Lin. 13640-13656 [doi]

Efficient Domain Adaptation for Non-Autoregressive Machine TranslationWangjie You, Pei Guo, Juntao Li, Kehai Chen, Min Zhang. 13657-13670 [doi]

Exploring Reversal Mathematical Reasoning Ability for Large Language ModelsPei Guo, Wangjie You, Juntao Li, Bowen Yan, Min Zhang 0005. 13671-13685 [doi]

A Unified Joint Approach with Topological Context Learning and Rule Augmentation for Knowledge Graph CompletionJingtao Guo, Chunxia Zhang 0001, Lingxi Li, Xiaojun Xue, Zhendong Niu. 13686-13696 [doi]

FreshLLMs: Refreshing Large Language Models with Search Engine AugmentationTu Vu, Mohit Iyyer, Xuezhi Wang 0002, Noah Constant, Jerry W. Wei, Jason Wei, Chris Tar, Yun-Hsuan Sung, Denny Zhou, Quoc V. Le, Thang Luong. 13697-13720 [doi]

ROSE Doesn't Do That: Boosting the Safety of Instruction-Tuned Large Language Models with Reverse Prompt Contrastive DecodingQihuang Zhong, Liang Ding 0006, Juhua Liu, Bo Du 0001, Dacheng Tao. 13721-13736 [doi]

CR-LLM: A Dataset and Optimization for Concept Reasoning of Large Language ModelsNianqi Li, JingPing Liu, Sihang Jiang, Haiyun Jiang, Yanghua Xiao, Jiaqing Liang, Zujie Liang, Feng Wei, Jinglei Chen, Zhenghong Hao, Bing Han. 13737-13747 [doi]

DATA-CUBE: Data Curriculum for Instruction-based Sentence Representation LearningYingqian Min, Kun Zhou 0002, Dawei Gao, Xin Zhao, He Hu 0001, Yaliang Li. 13748-13761 [doi]

Combating Label Sparsity in Short Text Topic Modeling via Nearest Neighbor AugmentationYang Lin, Xinyu Ma, Xin Gao, Ruiqing Li, Yasha Wang, Xu Chu. 13762-13774 [doi]

RefuteBench: Evaluating Refuting Instruction-Following for Large Language ModelsJianhao Yan, Yun Luo, Yue Zhang. 13775-13791 [doi]

Complex Logical Query Answering by Calibrating Knowledge Graph Completion ModelsChangyi Xiao, Yixin Cao 0002. 13792-13803 [doi]

Argument-Based Sentiment Analysis on Forward-Looking StatementsChin-Yi Lin, Chung-Chi Chen 0001, Hen-Hsen Huang, Hsin-Hsi Chen. 13804-13815 [doi]

Paying More Attention to Source Context: Mitigating Unfaithful Translations from Large Language ModelHongbin Zhang, Kehai Chen, Xuefeng Bai 0001, Yang Xiang, Min Zhang 0005. 13816-13836 [doi]

Unveiling the Power of Integration: Block Diagram Summarization through Local-Global FusionShreyanshu Bhushan, Eun-Soo Jung, Minho Lee. 13837-13856 [doi]

MultiSQL: A Schema-Integrated Context-Dependent Text2SQL Dataset with Diverse SQL OperationsChunhui Li, Yifan Wang, Zhen Wu, Zhen Yu, Fei Zhao, Shujian Huang, Xinyu Dai. 13857-13867 [doi]

Towards Demonstration-Aware Large Language Models for Machine TranslationChen Li, Meishan Zhang, Xuebo Liu 0002, Zhaocong Li, Derek F. Wong, Min Zhang 0005. 13868-13881 [doi]

DADA: Distribution-Aware Domain Adaptation of PLMs for Information RetrievalDohyeon Lee, Jongyoon Kim, Seung-won Hwang, Joonsuk Park. 13882-13893 [doi]

LLMs cannot find reasoning errors, but can correct them given the error locationGladys Tyen, Hassan Mansoor, Victor Carbune, Peter Chen, Tony Mak. 13894-13908 [doi]

Investigating the Impact of Data Contamination of Large Language Models in Text-to-SQL translationFederico Ranaldi, Elena Sofia Ruzzetti, Dario Onorati, Leonardo Ranaldi, Cristina Giannone, Andrea Favalli, Raniero Romagnoli, Fabio Massimo Zanzotto. 13909-13920 [doi]

ChartCheck: Explainable Fact-Checking over Real-World Chart ImagesMubashara Akhtar, Nikesh Subedi, Vivek Gupta 0001, Sahar Tahmasebi, Oana Cocarascu, Elena Simperl. 13921-13937 [doi]

Real World Conversational Entity Linking Requires More Than Zero-ShotsMohanna Hoveyda, Arjen P. de Vries, Faegheh Hasibi, Maarten de Rijke. 13938-13946 [doi]

CPsyCoun: A Report-based Multi-turn Dialogue Reconstruction and Evaluation Framework for Chinese Psychological CounselingChenhao Zhang 0005, Renhao Li, Minghuan Tan, Min Yang 0007, Jingwei Zhu, Di Yang, Jiahao Zhao, Guancheng Ye, Chengming Li, Xiping Hu 0001. 13947-13966 [doi]

Tox-BART: Leveraging Toxicity Attributes for Explanation Generation of Implicit Hate SpeechNeemesh Yadav, Sarah Masud, Vikram Goyal, Md. Shad Akhtar, Tanmoy Chakraborty 0002. 13967-13983 [doi]

TextGenSHAP: Scalable Post-Hoc Explanations in Text Generation with Long DocumentsJames Enouen, Hootan Nakhost, Sayna Ebrahimi, Sercan Ö Arik, Yan Liu 0002, Tomas Pfister. 13984-14011 [doi]

Balanced Data Sampling for Language Model Training with ClusteringYunfan Shao, Linyang Li, Zhaoye Fei, Hang Yan 0001, Dahua Lin, Xipeng Qiu. 14012-14023 [doi]

Length Generalization of Causal Transformers without Position EncodingJie Wang, Tao Ji, Yuanbin Wu, Hang Yan 0001, Tao Gui, Qi Zhang, Xuanjing Huang 0001, Xiaoling Wang. 14024-14040 [doi]

Unsupervised Sign Language Translation and GenerationZhengsheng Guo, Zhiwei He 0002, Wenxiang Jiao, Xing Wang, Rui Wang, Kehai Chen, Zhaopeng Tu, Yong Xu 0001, Min Zhang 0005. 14041-14055 [doi]

Mitigating Data Scarcity in Semantic Parsing across Languages with the Multilingual Semantic Layer and its DatasetAbelardo Carlos Martinez Lorenzo, Pere-Lluís Huguet Cabot, Karim Ghonim, Lu Xu, Hee-soo Choi, Alberte Fernández-Castro, Roberto Navigli. 14056-14080 [doi]

Efficient Sparse Attention needs Adaptive Token ReleaseChaoran Zhang, Lixin Zou, Dan Luo 0004, Xiangyang Luo, Zihao Li, Min Tang, Chenliang Li. 14081-14094 [doi]

Learning Fine-Grained Grounded Citations for Attributed Large Language ModelsLei Huang 0021, Xiaocheng Feng, Weitao Ma, Yuxuan Gu, Weihong Zhong, Xiachong Feng, Weijiang Yu, Weihua Peng, Duyu Tang, Dandan Tu, Bing Qin 0001. 14095-14113 [doi]

ReLiK: Retrieve and LinK, Fast and Accurate Entity Linking and Relation Extraction on an Academic BudgetRiccardo Orlando, Pere-Lluís Huguet Cabot, Edoardo Barba, Roberto Navigli. 14114-14132 [doi]

Synergizing Large Language Models and Pre-Trained Smaller Models for Conversational Intent DiscoveryJinggui Liang, Lizi Liao, Hao Fei 0001, Jing Jiang 0001. 14133-14147 [doi]

FENICE: Factuality Evaluation of summarization based on Natural language Inference and Claim ExtractionAlessandro Scirè, Karim Ghonim, Roberto Navigli. 14148-14161 [doi]

Self-Para-Consistency: Improving Reasoning Tasks at Low Cost for Large Language ModelsWenqing Chen, Weicheng Wang, Zhixuan Chu, Kui Ren 0001, Zibin Zheng, Zhichao Lu. 14162-14167 [doi]

Looking Right is Sometimes Right: Investigating the Capabilities of Decoder-only LLMs for Sequence LabelingDavid Dukic, Jan Snajder. 14168-14181 [doi]

mCSQA: Multilingual Commonsense Reasoning Dataset with Unified Creation Strategy by Language Models and HumansYusuke Sakai 0010, Hidetaka Kamigaito, Taro Watanabe. 14182-14214 [doi]

Dual-Stage Multi-Task Syntax-Oriented Pre-Training for Syntactically Controlled Paraphrase GenerationHongxu Liu, Xiaojie Wang 0006, Jiashen Sun, Ke Zeng, Guanglu Wan. 14215-14231 [doi]

Demonstration Augmentation for Zero-shot In-context LearningYi Su, Yunpeng Tai, Yixin Ji, Juntao Li, Yan Bowen, Min Zhang. 14232-14244 [doi]

Pushing the Limits of Zero-shot End-to-End Speech TranslationIoannis Tsiamas, Gerard I. Gállego, José A. R. Fonollosa, Marta R. Costa-Jussà. 14245-14267 [doi]

NUMCoT: Numerals and Units of Measurement in Chain-of-Thought Reasoning using Large Language ModelsAncheng Xu, Minghuan Tan, Lei Wang, Min Yang, Ruifeng Xu. 14268-14290 [doi]

On The Persona-based Summarization of Domain-Specific DocumentsAnkan Mullick, Sombit Bose, Rounak Saha, Ayan Kumar Bhowmick, Pawan Goyal 0002, Niloy Ganguly, Prasenjit Dey, Ravi Kokku. 14291-14307 [doi]

Evaluating Large Language Models for Health-related Queries with PresuppositionsNavreet Kaur, Monojit Choudhury, Danish Pruthi. 14308-14331 [doi]

Word Sense Linking: Disambiguating Outside the SandboxAndrei Stefan Bejgu, Edoardo Barba, Luigi Procopio, Alberte Fernández-Castro, Roberto Navigli. 14332-14347 [doi]

Generalisation First, Memorisation Second? Memorisation Localisation for Natural Language Classification TasksVerna Dankers, Ivan Titov. 14348-14366 [doi]

Towards Multi-Relational Multi-Hop Reasoning over Dense Temporal Knowledge GraphsJian Liu, Zihe Liu, Xueqiang Lyu, Peng Jin, Jinan Xu. 14367-14378 [doi]

Unsupervised Real-Time Hallucination Detection based on the Internal States of Large Language ModelsWeihang Su, Changyue Wang, Qingyao Ai, Yiran Hu, Zhijing Wu 0001, Yujia Zhou 0002, Yiqun Liu 0001. 14379-14391 [doi]

Progressive Tuning: Towards Generic Sentiment Abilities for Large Language ModelsGuiyang Hou, Yongliang Shen 0001, Weiming Lu 0001. 14392-14402 [doi]

Fooling the Textual Fooler via Randomizing Latent RepresentationsDuy C. Hoang, Nguyen Hung-Quang, Saurav Manchanda, Minlong Peng, Kok Seng Wong, Khoa D. Doan. 14403-14421 [doi]

Part-of-speech Tagging for Extremely Low-resource Indian LanguagesSanjeev Kumar, Preethi Jyothi, Pushpak Bhattacharyya. 14422-14431 [doi]

FOCUS: Forging Originality through Contrastive Use in Self-Plagiarism for Language ModelsKaixin Lan, Tao Fang, Derek F. Wong, Yabo Xu, Lidia S. Chao, Cecilia G. Zhao. 14432-14447 [doi]

Amanda: Adaptively Modality-Balanced Domain Adaptation for Multimodal Emotion RecognitionXinxin Zhang, Jun Sun, Simin Hong, Taihao Li. 14448-14458 [doi]

MedREQAL: Examining Medical Knowledge Recall of Large Language Models via Question AnsweringJuraj Vladika, Phillip Schneider, Florian Matthes. 14459-14469 [doi]

Deepfake Defense: Constructing and Evaluating a Specialized Urdu Deepfake Audio DatasetSheza Munir, Wassay Sajjad, Mukeet Raza, Emaan Abbas, Abdul Hameed Azeemi, Ihsan Ayyub Qazi, Agha Ali Raza. 14470-14480 [doi]

Leveraging Entailment Judgements in Cross-Lingual SummarisationHuajian Zhang, Laura Perez-Beltrachini. 14481-14497 [doi]

Recognizing Everything from All Modalities at Once: Grounded Multimodal Universal Information ExtractionMeishan Zhang, Hao Fei 0001, Bin Wang 0004, Shengqiong Wu, Yixin Cao 0002, Fei Li, Min Zhang. 14498-14511 [doi]

Enhanced Visual Instruction Tuning with Synthesized Image-Dialogue DataYanda Li, Chi Zhang, Gang Yu, Wanqi Yang, Zhibin Wang, Bin Fu, Guosheng Lin, Chunhua Shen, Ling Chen 0006, Yunchao Wei. 14512-14531 [doi]

Modeling Overregularization in Children with Small Language ModelsAkari Haga, Saku Sugawara, Akiyo Fukatsu, Miyu Oba, Hiroki Ouchi, Taro Watanabe, Yohei Oseki. 14532-14550 [doi]

Fantastic Semantics and Where to Find Them: Investigating Which Layers of Generative LLMs Reflect Lexical SemanticsZhu Liu, Cunliang Kong, Ying Liu, Maosong Sun 0001. 14551-14558 [doi]

Harnessing Large Language Models as Post-hoc CorrectorsZhiqiang Zhong, Kuangyu Zhou, Davide Mottin. 14559-14574 [doi]

Debatrix: Multi-dimensional Debate Judge with Iterative Chronological Analysis Based on LLMJingcong Liang, Rong Ye, Meng Han, Ruofei Lai, Xinyu Zhang, Xuanjing Huang, Zhongyu Wei. 14575-14595 [doi]

CycleAlign: Iterative Distillation from Black-box LLM to White-box Models for Better Human AlignmentJixiang Hong, Quan Tu, Changyu Chen, Gao Xing, Ji Zhang 0011, Rui Yan 0001. 14596-14609 [doi]

Towards a new research agenda for multimodal enterprise document understanding: What are we missing?Armineh Nourbakhsh, Sameena Shah, Carolyn P. Rosé. 14610-14622 [doi]

CAUSE: Counterfactual Assessment of User Satisfaction Estimation in Task-Oriented Dialogue SystemsAmin Abolghasemi, Zhaochun Ren, Arian Askari, Mohammad Aliannejadi, Maarten de Rijke, Suzan Verberne. 14623-14635 [doi]

Measuring Retrieval Complexity in Question Answering SystemsMatteo Gabburo, Nicolaas Paul Jedema, Siddhant Garg, Leonardo F. R. Ribeiro, Alessandro Moschitti. 14636-14650 [doi]

Combining Hierachical VAEs with LLMs for clinically meaningful timeline summarisation in social mediaJiayu Song, Jenny Chim, Adam Tsakalidis, Julia Ive, Dana Atzil-Slonim, Maria Liakata. 14651-14672 [doi]

PIXAR: Auto-Regressive Language Modeling in Pixel SpaceYintao Tai, Xiyang Liao, Alessandro Suglia, Antonio Vergari. 14673-14695 [doi]

Sparsity-Accelerated Training for Large Language ModelsDa Ma, Lu Chen 0002, Pengyu Wang, Hongshen Xu, Hanqi Li, Liangtai Sun, Su Zhu, Shuai Fan 0005, Kai Yu 0004. 14696-14707 [doi]

Preemptive Answer "Attacks" on Chain-of-Thought ReasoningRongwu Xu, Zehan Qi, Wei Xu. 14708-14726 [doi]

Do Language Models Exhibit Human-like Structural Priming Effects?Jaap Jumelet, Willem H. Zuidema, Arabella Sinclair. 14727-14742 [doi]

RoleLLM: Benchmarking, Eliciting, and Enhancing Role-Playing Abilities of Large Language ModelsNoah Wang, Z. Y. Peng, Haoran Que, Jiaheng Liu, Wangchunshu Zhou, Yuhan Wu, Hongcheng Guo, Ruitong Gan, Zehao Ni, Jian Yang 0030, Man Zhang 0005, Zhaoxiang Zhang 0001, Wanli Ouyang, Ke Xu 0001, Wenhao Huang, Jie Fu, Junran Peng. 14743-14777 [doi]

LangSuit·E: Planning, Controlling and Interacting with Large Language Models in Embodied Text EnvironmentsZixia Jia, Mengmeng Wang, Baichen Tong, Song Chun Zhu, Zilong Zheng. 14778-14814 [doi]

Views Are My Own, but Also Yours: Benchmarking Theory of Mind Using Common GroundAdil Soubki, John Murzaku, Arash Yousefi Jordehi, Peter Zeng, Magdalena Markowska, Seyed Abolghasem Mirroshandel, Owen Rambow. 14815-14823 [doi]

MAPLE: Multilingual Evaluation of Parameter Efficient Finetuning of Large Language ModelsDivyanshu Aggarwal, Ashutosh Sathe, Ishaan Watts, Sunayana Sitaram. 14824-14867 [doi]

MoE-SLU: Towards ASR-Robust Spoken Language Understanding via Mixture-of-ExpertsXuxin Cheng, Zhihong Zhu, Xianwei Zhuang, Zhanpeng Chen, Zhiqi Huang, Yuexian Zou. 14868-14879 [doi]

Multi-Task Transfer Matters During Instruction-TuningDavid Mueller, Mark Dredze, Nicholas Andrews. 14880-14891 [doi]

What Makes a Good Order of Examples in In-Context LearningQi Guo, Leiyu Wang, Yidong Wang, Wei Ye, Shikun Zhang. 14892-14904 [doi]

BloomVQA: Assessing Hierarchical Multi-modal ComprehensionYunye Gong, Robik Shrestha, Jared Claypoole, Michael Cogswell, Arijit Ray, Christopher Kanan, Ajay Divakaran. 14905-14918 [doi]

AttributionBench: How Hard is Automatic Attribution Evaluation?Yifei Li, Xiang Yue, Zeyi Liao, Huan Sun 0001. 14919-14935 [doi]

Diffusion Guided Language ModelingJustin Lovelace, Varsha Kishore, Yiwei Chen, Kilian Q. Weinberger. 14936-14952 [doi]

InstructEd: Soft-Instruction Tuning for Model Editing with HopsXiaoqi Han, Ru Li 0001, Xiaoli Li 0001, Jiye Liang, Zifang Zhang, Jeff Z. Pan. 14953-14968 [doi]

TLCR: Token-Level Continuous Reward for Fine-grained Reinforcement Learning from Human FeedbackEunseop Yoon, Hee Suk Yoon, SooHwan Eom, Gunsoo Han, Daniel Wontae Nam, DaeJin Jo, Kyoung-woon On, Mark Hasegawa-Johnson, Sungwoong Kim, Chang Dong Yoo. 14969-14981 [doi]

Found in the middle: Calibrating Positional Attention Bias Improves Long Context UtilizationCheng-Yu Hsieh, Yung-Sung Chuang, Chun-Liang Li, Zifeng Wang 0002, Long T. Le, Abhishek Kumar, James R. Glass, Alexander Ratner, Chen-Yu Lee, Ranjay Krishna, Tomas Pfister. 14982-14995 [doi]

S3-DST: Structured Open-Domain Dialogue Segmentation and State Tracking in the Era of LLMsSarkar Snigdha Sarathi Das, Chirag Shah, Mengting Wan, Jennifer Neville, Longqi Yang, Reid Andersen, Georg Buscher, Tara Safavi. 14996-15014 [doi]

Set the Clock: Temporal Alignment of Pretrained Language ModelsBowen Zhao, Zander Brumbaugh, Yizhong Wang, Hannaneh Hajishirzi, Noah A. Smith. 15015-15040 [doi]

From One to Many: Expanding the Scope of Toxicity Mitigation in Language ModelsBeyza Ermis, Luiza Pozzobon, Sara Hooker, Patrick Lewis. 15041-15058 [doi]

Here's a Free Lunch: Sanitizing Backdoored Models with Model MergeAnsh Arora, Xuanli He, Maximilian Mozes, Srinibas Swain, Mark Dras, Qiongkai Xu. 15059-15075 [doi]

Enhancing Sentence Simplification in Portuguese: Leveraging Paraphrases, Context, and Linguistic FeaturesArthur Scalercio, Maria José Finatto, Aline Paes. 15076-15091 [doi]

How Far can 100 Samples Go? Unlocking Zero-Shot Translation with Tiny Multi-Parallel DataDi Wu, Shaomu Tan, Yan Meng, David Stap, Christof Monz. 15092-15108 [doi]

Toward Reliable Ad-hoc Scientific Information Extraction: A Case Study on Two Materials DatasetSatanu Ghosh, Neal R. Brodnik, Carolina Frey, Collin Holgate, Tresa M. Pollock, Samantha H. Daly, Samuel Carton. 15109-15123 [doi]

Structural Optimization Ambiguity and Simplicity Bias in Unsupervised Neural Grammar InductionJinwook Park, Kangil Kim. 15124-15139 [doi]

LMDX: Language Model-based Document Information Extraction and LocalizationVincent Perot, Kai Kang, Florian Luisier, Guolong Su, Xiaoyu Sun, Ramya Sree Boppana, Zilong Wang, Zifeng Wang, Jiaqi Mu, Hao Zhang, Chen-Yu Lee, Nan Hua. 15140-15168 [doi]

DBQR-QA: A Question Answering Dataset on a Hybrid of Database Querying and ReasoningRungsiman Nararatwong, Chung-Chi Chen 0001, Natthawut Kertkeidkachorn, Hiroya Takamura, Ryutaro Ichise. 15169-15182 [doi]

NoteChat: A Dataset of Synthetic Patient-Physician Conversations Conditioned on Clinical NotesJunda Wang, Zonghai Yao, Zhichao Yang 0001, Huixue Zhou, Rumeng Li, Xun Wang, Yucheng Xu, Hong Yu 0001. 15183-15201 [doi]

Model Editing at Scale leads to Gradual and Catastrophic ForgettingAkshat Gupta, Anurag Rao, Gopala Anumanchipalli. 15202-15232 [doi]

3MVRD: Multimodal Multi-task Multi-teacher Visually-Rich Form Document UnderstandingYihao Ding, Lorenzo Vaiani, Soyeon Caren Han, Jean Lee, Paolo Garza, Josiah Poon, Luca Cagliero. 15233-15244 [doi]

Faithful Persona-based Conversational Dataset Generation with Large Language ModelsPegah Jandaghi, XiangHai Sheng, Xinyi Bai, Jay Pujara, Hakim Sidahmed. 15245-15270 [doi]

Vision-Flan: Scaling Human-Labeled Tasks in Visual Instruction TuningZhiyang Xu, Chao Feng, Rulin Shao, Trevor Ashby, Ying Shen, Di Jin, Yu Cheng, Qifan Wang, Lifu Huang. 15271-15342 [doi]

TAXI: Evaluating Categorical Knowledge Editing for Language ModelsDerek Powell, Walter Gerych, Thomas Hartvigsen. 15343-15352 [doi]

Automatic Bug Detection in LLM-Powered Text-Based Games Using LLMsClaire Jin, Sudha Rao, Xiangyu Peng, Portia Botchway, Jessica Quaye, Chris Brockett, Bill Dolan. 15353-15368 [doi]

Embodied Language Learning: Opportunities, Challenges, and Future DirectionsNadine Amin, Julia Rayz. 15369-15379 [doi]

Challenges to Evaluating the Generalization of Coreference Resolution Models: A Measurement Modeling PerspectiveIan Porada, Alexandra Olteanu, Kaheer Suleman, Adam Trischler, Jackie Chi Kit Cheung. 15380-15395 [doi]

SAGA: A Participant-specific Examination of Story Alternatives and Goal Applicability for a Deeper Understanding of Complex EventsSai Vallurupalli, Katrin Erk, Francis Ferraro. 15396-15420 [doi]

SLIDE: A Framework Integrating Small and Large Language Models for Open-Domain Dialogues EvaluationKun Zhao 0007, Bohao Yang, Chen Tang, Chenghua Lin, Liang Zhan. 15421-15435 [doi]

Deep Exploration of Cross-Lingual Zero-Shot Generalization in Instruction TuningJanghoon Han, Changho Lee, Joongbo Shin, Stanley Jungkyu Choi, Honglak Lee, Kyunghoon Bae. 15436-15452 [doi]

What Makes Language Models Good-enough?Daiki Asami, Saku Sugawara. 15453-15467 [doi]

Refining Corpora from a Model Calibration Perspective for Chinese Spelling CorrectionDingyao Yu, Yang An, Wei Ye, Xiongfeng Xiao, Shaoguang Mao, Tao Ge 0001, Shikun Zhang. 15468-15480 [doi]

CounterCurate: Enhancing Physical and Semantic Visio-Linguistic Compositional Reasoning via Counterfactual ExamplesJianrui Zhang, Mu Cai, Tengyang Xie, Yong Jae Lee. 15481-15495 [doi]

Knowledge-Infused Prompting: Assessing and Advancing Clinical Text Data Generation with Large Language ModelsRan Xu, Hejie Cui, Yue Yu, Xuan Kan, Wenqi Shi, Yuchen Zhuang, May Dongmei Wang, Wei Jin 0009, Joyce Ho, Carl Yang 0001. 15496-15523 [doi]

Textless Acoustic Model with Self-Supervised Distillation for Noise-Robust Expressive Speech-to-Speech TranslationMin-Jae Hwang, Ilia Kulikov, Benjamin Peloquin, Hongyu Gong, Peng-Jen Chen, Ann Lee 0001. 15524-15541 [doi]

Knowledge-Infused Legal Wisdom: Navigating LLM Consultation through the Lens of Diagnostics and Positive-Unlabeled Reinforcement LearningYang Wu, Chenghao Wang, Ece Gumusel, Xiaozhong Liu. 15542-15555 [doi]

TELLER: A Trustworthy Framework for Explainable, Generalizable and Controllable Fake News DetectionHui Liu, Wenya Wang, Haoru Li, Haoliang Li. 15556-15583 [doi]

Verifiable Generation with Subsentence-Level Fine-Grained CitationsShuyang Cao, Lu Wang 0008. 15584-15596 [doi]

Tailoring with Targeted Precision: Edit-Based Agents for Open-Domain Procedure CustomizationYash Kumar Lal, Li Zhang 0039, Faeze Brahman, Bodhisattwa Prasad Majumder, Peter Clark, Niket Tandon. 15597-15611 [doi]

A Meta-Learning Perspective on Transformers for Causal Language ModelingXinbo Wu, Lav R. Varshney. 15612-15622 [doi]

PLaD: Preference-based Large Language Model Distillation with Pseudo-Preference PairsRongzhi Zhang, Jiaming Shen, Tianqi Liu 0002, Haorui Wang, Zhen Qin 0001, Feng Han, Jialu Liu, Simon Baumgartner, Michael Bendersky, Chao Zhang. 15623-15636 [doi]

Small Language Models Need Strong Verifiers to Self-Correct ReasoningYunxiang Zhang, Muhammad Khalifa, Lajanugen Logeswaran, Jaekyeom Kim, Moontae Lee, Honglak Lee, Lu Wang 0008. 15637-15653 [doi]

Hire a Linguist!: Learning Endangered Languages in LLMs with In-Context Linguistic DescriptionsKexun Zhang, Yee Man Choi, Zhenqiao Song, Taiqi He, William Yang Wang, Lei Li 0005. 15654-15669 [doi]

From Tarzan to Tolkien: Controlling the Language Proficiency Level of LLMs for Content GenerationAli Malik, Stephen Mayhew 0001, Christopher Piech, Klinton Bicknell. 15670-15693 [doi]

From Representational Harms to Quality-of-Service Harms: A Case Study on Llama 2 Safety SafeguardsKhaoula Chehbouni, Megha Roshan, Emmanuel Ma, Futian Andrew Wei, Afaf Taïk, Jackie Chi Kit Cheung, Golnoosh Farnadi. 15694-15710 [doi]

CToolEval: A Chinese Benchmark for LLM-Powered Agent Evaluation in Real-World API InteractionsZishan Guo, Yufei Huang 0005, Deyi Xiong. 15711-15724 [doi]

Token Alignment via Character Matching for Subword CompletionBen Athiwaratkun, Shiqi Wang 0002, Mingyue Shang, Yuchen Tian, Zijian Wang 0002, Sujan Kumar Gonugondla, Sanjay Krishna Gouda, Robert Kwiatkowski, Ramesh Nallapati, Parminder Bhatia, Bing Xiang. 15725-15738 [doi]

Rethinking Efficient Multilingual Text Summarization Meta-EvaluationRilyn Han, Jiawen Chen, Yixin Liu 0003, Arman Cohan. 15739-15746 [doi]

emotion2vec: Self-Supervised Pre-Training for Speech Emotion RepresentationZiyang Ma, Zhisheng Zheng, Jiaxin Ye, Jinchao Li, Zhifu Gao, Shiliang Zhang, Xie Chen 0001. 15747-15760 [doi]

Language-Informed Beam Search Decoding for Multilingual Machine TranslationYilin Yang, Stefan Lee, Prasad Tadepalli. 15761-15772 [doi]

RA-LoRA: Rank-Adaptive Parameter-Efficient Fine-Tuning for Accurate 2-bit Quantized Large Language ModelsMinsoo Kim, Sihwa Lee, Wonyong Sung, Jungwook Choi. 15773-15786 [doi]

The PGNSC Benchmark: How Do We Predict Where Information Spreads?Alexander Taylor, Wei Wang. 15787-15803 [doi]

STARLING: Self-supervised Training of Text-based Reinforcement Learning Agent with Large Language ModelsShreyas Basavatia, Keerthiram Murugesan, Shivam Ratnakar. 15804-15819 [doi]

Protecting Privacy Through Approximating Optimal Parameters for Sequence Unlearning in Language ModelsDohyun Lee, Daniel Rim, Minseok Choi, Jaegul Choo. 15820-15839 [doi]

Mitigating Hallucinations in Large Vision-Language Models with Instruction Contrastive DecodingXintong Wang, Jingheng Pan, Liang Ding, Chris Biemann. 15840-15853 [doi]

Fine-tuning Language Models for Joint Rewriting and Completion of Code with Potential BugsDingmin Wang, Jinman Zhao, Hengzhi Pei, Samson Tan, Sheng Zha. 15854-15868 [doi]

A Critical Study of What Code-LLMs (Do Not) LearnAbhinav Anand, Shweta Verma, Krishna Narasimhan, Mira Mezini. 15869-15889 [doi]

Visual In-Context Learning for Large Vision-Language ModelsYucheng Zhou, Xiang Li, Qianning Wang, Jianbing Shen. 15890-15902 [doi]

SCALE: Synergized Collaboration of Asymmetric Language Translation EnginesXin Cheng, Xun Wang, Tao Ge 0001, Si-Qing Chen, Furu Wei, Dongyan Zhao 0001, Rui Yan 0001. 15903-15918 [doi]

No perspective, no perception!! Perspective-aware Healthcare Answer SummarizationGauri Naik, Sharad Chandakacherla, Shweta Yadav 0001, Md. Shad Akhtar. 15919-15932 [doi]

Retrieval-Augmented Retrieval: Large Language Models are Strong Zero-Shot RetrieverTao Shen 0001, Guodong Long, Xiubo Geng, Chongyang Tao, Yibin Lei, Tianyi Zhou 0001, Michael Blumenstein, Daxin Jiang. 15933-15946 [doi]

A Survey on Predicting the Factuality and the Bias of News MediaPreslav Nakov, Jisun An, Haewoon Kwak, Muhammad Arslan Manzoor, Zain Muhammad Mujahid, Husrev T. Sencar. 15947-15962 [doi]

Semantic Compression for Word and Sentence Embeddings using Discrete Wavelet TransformRana Aref Salama, Abdou Youssef, Mona T. Diab. 15963-15977 [doi]

Improving Multi-hop Logical Reasoning in Knowledge Graphs with Context-Aware Query Representation LearningJeonghoon Kim, Heesoo Jung, Hyeju Jang, Hogun Park. 15978-15991 [doi]

ProgGen: Generating Named Entity Recognition Datasets Step-by-step with Self-Reflexive Large Language ModelsYuzhao Heng, Chunyuan Deng, Yitong Li, Yue Yu, Yinghao Li, Rongzhi Zhang, Chao Zhang. 15992-16030 [doi]

Defending LLMs against Jailbreaking Attacks via BacktranslationYihan Wang, Zhouxing Shi, Andrew Bai, Cho-Jui Hsieh. 16031-16046 [doi]

A Large Collection of Model-generated Contradictory Responses for Consistency-aware Dialogue SystemsShiki Sato, Reina Akama, Jun Suzuki, Kentaro Inui. 16047-16062 [doi]

Exploring Reasoning Biases in Large Language Models Through Syllogism: Insights from the NeuBAROCO DatasetKentaro Ozeki, Risako Ando, Takanobu Morishita, Hirohiko Abe, Koji Mineshima, Mitsuhiro Okada. 16063-16077 [doi]

Unveiling the Spectrum of Data Contamination in Language Model: A Survey from Detection to RemediationChunyuan Deng, Yilun Zhao 0001, Yuzhao Heng, Yitong Li, Jiannan Cao, Xiangru Tang, Arman Cohan. 16078-16092 [doi]

DIMSIM: Distilled Multilingual Critics for Indic Text SimplificationSneha Mondal, Ritika, Ashish Agrawal, Preethi Jyothi, Aravindan Raghuveer. 16093-16109 [doi]

MATTER: Memory-Augmented Transformer Using Heterogeneous Knowledge SourcesDongkyu Lee, Chandana Satya Prakash, Jack FitzGerald, Jens Lehmann 0001. 16110-16121 [doi]

Ask LLMs Directly, "What shapes your bias?": Measuring Social Bias in Large Language ModelsJisu Shin, Hoyun Song, Huije Lee, Soyeong Jeong, Jong Park. 16122-16143 [doi]

Chain-of-History Reasoning for Temporal Knowledge Graph ForecastingYuwei Xia, Ding Wang, Qiang Liu 0006, Liang Wang 0056, Shu Wu, Xiao-Yu Zhang. 16144-16159 [doi]

Can LLMs Speak For Diverse People? Tuning LLMs via Debate to Generate Controllable Controversial StatementsMing Li, Jiuhai Chen, Lichang Chen, Tianyi Zhou. 16160-16176 [doi]

Label-aware Hard Negative Sampling Strategies with Momentum Contrastive Learning for Implicit Hate Speech DetectionJaehoon Kim, Seungwan Jin, Sohyun Park, Someen Park, Kyungsik Han. 16177-16188 [doi]

Selective Reflection-Tuning: Student-Selected Data Recycling for LLM Instruction-TuningMing Li, Lichang Chen, Jiuhai Chen, Shwai He, Jiuxiang Gu, Tianyi Zhou. 16189-16211 [doi]

Selective Prompting Tuning for Personalized Conversations with LLMsQiushi Huang, Xubo Liu, Tom Ko, Bo Wu 0018, Wenwu Wang 0001, Yu Zhang, Lilian Tang. 16212-16226 [doi]

Sowing the Wind, Reaping the Whirlwind: The Impact of Editing Language ModelsRima Hazra, Sayan Layek, Somnath Banerjee, Soujanya Poria. 16227-16239 [doi]

ContextBLIP: Doubly Contextual Alignment for Contrastive Image Retrieval from Linguistically Complex DescriptionsHonglin Lin, Siyu Li, Guoshun Nan, Chaoyue Tang, Xueting Wang, Jingxin Xu, Yankai Rong, Zhouzhili Zhouzhili, Yutong Gao 0001, Qimei Cui, Xiaofeng Tao. 16240-16258 [doi]

PuzzleVQA: Diagnosing Multimodal Reasoning Challenges of Language Models with Abstract Visual PatternsYew Ken Chia, Vernon Toh, Deepanway Ghosal, Lidong Bing, Soujanya Poria. 16259-16273 [doi]

How Do Moral Emotions Shape Political Participation? A Cross-Cultural Analysis of Online Petitions Using Language ModelsJaehong Kim, Chaeyoon Jeong, Seongchan Park, Meeyoung Cha, Wonjae Lee. 16274-16289 [doi]

VillagerAgent: A Graph-Based Multi-Agent Framework for Coordinating Complex Task Dependencies in MinecraftYubo Dong, Xukun Zhu, Zhengzhe Pan, Linchao Zhu, Yi Yang 0001. 16290-16314 [doi]

CF-TCIR: A Compositor-Free Framework for Hierarchical Text-Conditioned Image RetrievalYuchen Yang, Yu Wang, Yanfeng Wang. 16315-16325 [doi]

DMIN: A Discourse-specific Multi-granularity Integration Network for Conversational Aspect-based Sentiment Quadruple AnalysisPeijie Huang, Xisheng Xiao, Yuhong Xu, Jiawei Chen. 16326-16338 [doi]

Are Decoder-Only Language Models Better than Encoder-Only Language Models in Understanding Word Meaning?Muhammad Reza Qorib, Geonsik Moon, Hwee Tou Ng. 16339-16347 [doi]

FragRel: Exploiting Fragment-level Relations in the External Memory of Large Language ModelsXihang Yue, Linchao Zhu, Yi Yang 0001. 16348-16361 [doi]

On the Robustness of Document-Level Relation Extraction Models to Entity Name VariationsShiao Meng, Xuming Hu, Aiwei Liu, Fukun Ma, YaWen Yang, Shuang Li 0015, Lijie Wen 0001. 16362-16374 [doi]

RESEMO: A Benchmark Chinese Dataset for Studying Responsive Emotion from Social Media ContentBo Hu, Meng Zhang, Chenfei Xie, Yuanhe Tian, Yan Song, Zhendong Mao. 16375-16387 [doi]

EHR-SeqSQL : A Sequential Text-to-SQL Dataset For Interactively Exploring Electronic Health RecordsJaehee Ryu, Seonhee Cho, Gyubok Lee, Edward Choi. 16388-16407 [doi]

KEEP CHATTING! An Attractive Dataset for Continuous Conversation AgentsYihe Wang, Jin Liu, Yao Wan 0001, Yitong Li, Zifeng Liu, Weipeng Chen. 16408-16414 [doi]

RePair: Automated Program Repair with Process-based FeedbackYuze Zhao, Zhenya Huang, Yixiao Ma, Rui Li, Kai Zhang, Hao Jiang, Qi Liu, Linbo Zhu, Yu Su 0002. 16415-16429 [doi]

Concise and Precise Context Compression for Tool-Using Language ModelsYang Xu, Yunlong Feng, Honglin Mu, Yutai Hou, Yitong Li, Xinghao Wang, Wanjun Zhong, Zhongyang Li, Dandan Tu, Qingfu Zhu, Min Zhang, Wanxiang Che. 16430-16441 [doi]

MedDec: A Dataset for Extracting Medical Decisions from Discharge SummariesMohamed Elgaar, Jiali Cheng, Nidhi Vakil, Hadi Amiri, Leo Anthony Celi. 16442-16455 [doi]

External Links

Cite Key

Statistics

PDF

Researchr

Findings of the Association for Computational Linguistics, ACL 2024, Bangkok, Thailand and virtual meeting, August 11-16, 2024

Abstract

Table of Contents