Findings of the Association for Computational Linguistics: EMNLP 2024, Miami, Florida, USA, November 12-16, 2024

researchr

You are not signed in
Sign in
Sign up

Yaser Al-Onaizan, Mohit Bansal, Yun-Nung Chen, editors, Findings of the Association for Computational Linguistics: EMNLP 2024, Miami, Florida, USA, November 12-16, 2024. Association for Computational Linguistics, 2024. [doi]

Conference: emnlp2024

Abstract is missing.

Frontmatter [doi]

Are LLMs Good Annotators for Discourse-level Event Relation Extraction?Kangda Wei, Aayush Gautam, Ruihong Huang. 1-19 [doi]

Transferability of Syntax-Aware Graph Neural Networks in Zero-Shot Cross-Lingual Semantic Role LabelingRachel Devianti, Yusuke Miyao. 20-42 [doi]

Should Cross-Lingual AMR Parsing go Meta? An Empirical Assessment of Meta-Learning and Joint Learning AMR ParsingJeongwoo Kang 0001, Maximin Coavoux, Cédric Lopez, Didier Schwab. 43-51 [doi]

General Collaborative Framework between Large Language Model and Experts for Universal Information ExtractionKunlong Bao, Ning Wang. 52-77 [doi]

SEAVER: Attention Reallocation for Mitigating Distractions in Language Models for Conditional Semantic Textual Similarity MeasurementBaixuan Li, Yunlong Fan, Zhiqiang Gao. 78-95 [doi]

Search if you don't know! Knowledge-Augmented Korean Grammatical Error Correction with Large Language ModelsSeonmin Koo, Jinsung Kim, Chanjun Park, HeuiSeok Lim. 96-125 [doi]

Measuring the Robustness of NLP Models to Domain ShiftsNitay Calderon, Naveh Porat, Eyal Ben-David, Alexander Chapanin, Zorik Gekhman, Nadav Oved, Vitaly Shalumov, Roi Reichart. 126-154 [doi]

Text2Model: Text-based Model Induction for Zero-shot Image ClassificationOhad Amosy, Tomer Volk, Eilam Shapira, Eyal Ben-David, Roi Reichart, Gal Chechik. 155-172 [doi]

InsertGNN: A Hierarchical Graph Neural Network for the TOEFL Sentence Insertion ProblemFang Wu, Stan Z. Li. 173-180 [doi]

Unleashing Large Language Models' Proficiency in Zero-shot Essay ScoringSanwoo Lee, Yida Cai, Desong Meng, Ziyang Wang, Yunfang Wu. 181-198 [doi]

DetectBench: Can Large Language Model Detect and Piece Together Implicit Evidence?Zhouhong Gu, Lin Zhang, Xiaoxuan Zhu, Jiangjie Chen, Wenhao Huang, Yikai Zhang, Shusen Wang, Zheyu Ye, Yan Gao, Hongwei Feng, Yanghua Xiao. 199-222 [doi]

Improve Meta-learning for Few-Shot Text Classification with All You Can Acquire from the TasksXinyue Liu, Yunlong Gao, Linlin Zong, Bo Xu 0009. 223-235 [doi]

CoTAR: Chain-of-Thought Attribution Reasoning with Multi-level GranularityMoshe Berchansky, Daniel Fleischer, Moshe Wasserblat, Peter Izsak. 236-246 [doi]

SnapNTell: Enhancing Entity-Centric Visual Question Answering with Retrieval Augmented Multimodal LLMJielin Qiu, Andrea Madotto, Zhaojiang Lin, Paul A. Crook, Yifan Ethan Xu, Babak Damavandi, Xin Dong 0001, Christos Faloutsos, Lei Li 0005, Seungwhan Moon. 247-266 [doi]

SRAP-Agent: Simulating and Optimizing Scarce Resource Allocation Policy with LLM-based AgentJiarui Ji, Yang Li, Hongtao Liu, Zhicheng Du, Zhewei Wei, Qi Qi, Weiran Shen, Yankai Lin. 267-293 [doi]

Ukrainian Resilience: A Dataset for Detection of Help-Seeking Signals Amidst the Chaos of WarMSVPJ Sathvik, Abhilash Dowpati, Srreyansh Sethi. 294-300 [doi]

Selective Annotation via Data Allocation: These Data Should Be Triaged to Experts for Annotation Rather Than the ModelChen Huang, Yang Deng 0002, Wenqiang Lei, Jiancheng Lv 0001, Ido Dagan. 301-320 [doi]

Document Hashing with Multi-Grained Prototype-Induced Hierarchical Generative ModelQian Zhang, Qinliang Su, Jiayang Chen, Zhenpeng Song. 321-333 [doi]

Predictive Multiplicity of Knowledge Graph Embeddings in Link PredictionYuqicheng Zhu, Nico Potyka, Mojtaba Nayyeri, Bo Xiong, Yunjie He, Evgeny Kharlamov, Steffen Staab. 334-354 [doi]

Temporal Fact Reasoning over Hyper-Relational Knowledge GraphsZifeng Ding, Jingcheng Wu, Jingpei Wu, Yan Xia 0003, Bo Xiong, Volker Tresp. 355-373 [doi]

GREEN: Generative Radiology Report Evaluation and Error NotationSophie Ostmeier, Justin Xu, Zhihong Chen, Maya Varma, Louis Blankemeier, Christian Bluethgen, Arne Md, Michael E. Moseley, Curtis P. Langlotz, Akshay Chaudhari, Jean-Benoit Delbrouck. 374-390 [doi]

XRec: Large Language Models for Explainable RecommendationQiyao Ma, Xubin Ren, Chao Huang 0001. 391-402 [doi]

LLM Questionnaire Completion for Automatic Psychiatric AssessmentGony Rosenman, Talma Hendler, Lior Wolf. 403-415 [doi]

Disordered-DABS: A Benchmark for Dynamic Aspect-Based Summarization in Disordered TextsXiaobo Guo, Soroush Vosoughi. 416-431 [doi]

Walia-LLM: Enhancing Amharic-LLaMA by Integrating Task-Specific and Generative DatasetsIsrael Abebe Azime, Atnafu Lambebo Tonja, Tadesse Destaw Belay, Mitiku Yohannes Fuge, Aman Kassahun Wassie, Eyasu Shiferaw Jada, Yonas Chanie, Walelign Tewabe Sewunetie, Seid Muhie Yimam. 432-444 [doi]

Can Large Language Models Identify Authorship?Baixiang Huang, Canyu Chen, Kai Shu. 445-460 [doi]

TransLLaMa: LLM-based Simultaneous Translation SystemRoman Koshkin, Katsuhito Sudoh, Satoshi Nakamura 0001. 461-476 [doi]

Axis Tour: Word Tour Determines the Order of Axes in ICA-transformed EmbeddingsHiroaki Yamagiwa, Yusuke Takase, Hidetoshi Shimodaira. 477-506 [doi]

Granularity is crucial when applying differential privacy to text: An investigation for neural machine translationDoan Nam Long Vu, Timour Igamberdiev, Ivan Habernal. 507-527 [doi]

An Open-Source Data Contamination Report for Large Language ModelsYucheng Li 0001, Yunhao Guo, Frank Guerin, Chenghua Lin. 528-541 [doi]

Few shot chain-of-thought driven reasoning to prompt LLMs for open-ended medical question answeringSaeel Sandeep Nachane, Ojas Gramopadhye, Prateek Chanda, Ganesh Ramakrishnan, Kshitij Sharad Jadhav, Yatin Nandwani, Dinesh Raghu, Sachindra Joshi. 542-573 [doi]

Reformatted AlignmentRun-Ze Fan, Xuefeng Li, Haoyang Zou, Junlong Li, Shwai He, Ethan Chern, Jiewen Hu, Pengfei Liu. 574-597 [doi]

Unsupervised Domain Adaptation for Keyphrase Generation using Citation ContextsFlorian Boudin, Akiko Aizawa. 598-614 [doi]

SMILE: Single-turn to Multi-turn Inclusive Language Expansion via ChatGPT for Mental Health SupportHuachuan Qiu, Hongliang He, Shuai Zhang, Anqi Li, Zhenzhong Lan. 615-636 [doi]

DocEE-zh: A Fine-grained Benchmark for Chinese Document-level Event ExtractionMinghui Liu, Meihan Tong, Yangda Peng, Lei Hou 0001, Juanzi Li, Bin Xu 0001. 637-649 [doi]

MalayMMLU: A Multitask Benchmark for the Low-Resource Malay LanguageSoon Chang Poh, Sze Jue Yang, Jeraelyn Tan, Lawrence Chieng, Jia Huei Tan, Zhenyu Yu, Foong Mun, Chee Seng Chan. 650-669 [doi]

Symbolic Prompt Program Search: A Structure-Aware Approach to Efficient Compile-Time Prompt OptimizationTobias Schnabel, Jennifer Neville. 670-686 [doi]

Learning to Route for Dynamic Adapter Composition in Continual Learning with Language ModelsVladimir Araujo, Marie-Francine Moens, Tinne Tuytelaars. 687-696 [doi]

LLM-supertagger: Categorial Grammar Supertagging via Large Language ModelsJinman Zhao, Gerald Penn. 697-705 [doi]

Editing Conceptual Knowledge for Large Language ModelsXiaohan Wang, Shengyu Mao, Shumin Deng, Yunzhi Yao, Yue Shen, Lei Liang, Jinjie Gu, Huajun Chen, Ningyu Zhang 0001. 706-724 [doi]

RAG-Studio: Towards In-Domain Adaptation of Retrieval Augmented Generation Through Self-AlignmentKelong Mao, Zheng Liu 0011, Hongjin Qian, Fengran Mo, Chenlong Deng, Zhicheng Dou. 725-735 [doi]

MMCode: Benchmarking Multimodal Large Language Models for Code Generation with Visually Rich Programming ProblemsKaixin Li, Yuchen Tian, Qisheng Hu, Ziyang Luo, Zhiyong Huang, Jing Ma 0004. 736-783 [doi]

Enabling Discriminative Reasoning in LLMs for Legal Judgment PredictionChenlong Deng, Kelong Mao, Yuyao Zhang, Zhicheng Dou. 784-796 [doi]

Preserving Pre-trained Representation Space: On Effectiveness of Prefix-tuning for Large Multi-modal ModelsDonghoon Kim, Gusang Lee, Kyuhong Shim, Byonghyo Shim. 797-819 [doi]

What Would Happen Next? Predicting Consequences from An Event Causality GraphChuanhong Zhan, Wei Xiang 0005, Liang Chao, Bang Wang. 820-832 [doi]

Can LLMs Learn From Mistakes? An Empirical Study on Reasoning TasksShengnan An, Zexiong Ma, Siqi Cai, Zeqi Lin, Nanning Zheng 0001, Jian-Guang Lou, Weizhu Chen. 833-854 [doi]

Temporal Cognitive Tree: A Hierarchical Modeling Approach for Event Temporal Relation ExtractionWanting Ning, Lishuang Li, Xueyang Qin, Yubo Feng, Jingyao Tang. 855-864 [doi]

LongGenBench: Long-context Generation BenchmarkXiang Liu, Peijie Dong, Xuming Hu, Xiaowen Chu 0001. 865-883 [doi]

RaFe: Ranking Feedback Improves Query Rewriting for RAGShengyu Mao, Yong Jiang 0001, Boli Chen, Xiao Li, Peng Wang 0104, Xinyu Wang 0013, Pengjun Xie, Fei Huang 0004, Huajun Chen, Ningyu Zhang 0001. 884-901 [doi]

BASES: Large-scale Web Search User Simulation with Large Language Model based AgentsRuiyang Ren, Peng Qiu, Yingqi Qu, Jing Liu 0022, Xin Zhao 0018, Hua Wu 0003, Ji-Rong Wen, Haifeng Wang 0001. 902-917 [doi]

Make Large Language Model a Better RankerWenshuo Chao, Zhi Zheng 0008, Hengshu Zhu, Hao Liu 0026. 918-929 [doi]

SpeciaLex: A Benchmark for In-Context Specialized Lexicon LearningJoseph Marvin Imperial, Harish Tayyar Madabushi. 930-965 [doi]

Devil's Advocate: Anticipatory Reflection for LLM AgentsHaoyu Wang 0005, Tao Li 0039, Zhiwei Deng, Dan Roth, Yang Li 0150. 966-978 [doi]

API Is Enough: Conformal Prediction for Large Language Models Without Logit-AccessJiayuan Su, Jing Luo, Hongwei Wang, Lu Cheng. 979-995 [doi]

Introducing Compiler Semantics into Large Language Models as Programming Language Translators: A Case Study of C to x86 AssemblyShuoming Zhang, Jiacheng Zhao, Chunwei Xia, Zheng Wang 0001, Yunji Chen, Huimin Cui. 996-1011 [doi]

Negating Negatives: Alignment with Human Negative Samples via Distributional Dispreference OptimizationShitong Duan, Xiaoyuan Yi, Peng Zhang 0060, Yan Liu 0002, Zheng Liu 0011, Tun Lu, Xing Xie 0001, Ning Gu. 1012-1042 [doi]

OffsetBias: Leveraging Debiased Data for Tuning EvaluatorsJunsoo Park, Seungyeon Jwa, Meiying Ren, Daeyoung Kim, Sanghyuk Choi. 1043-1067 [doi]

Employing Glyphic Information for Chinese Event Extraction with Vision-Language ModelXiaoyi Bao, Jinghang Gu, Zhongqing Wang, Minjie Qiang, Chu-Ren Huang. 1068-1080 [doi]

Can CLIP Count Stars? An Empirical Study on Quantity Bias in CLIPZeliang Zhang, Zhuo Liu, Mingqian Feng, Chenliang Xu. 1081-1086 [doi]

LLM-A*: Large Language Model Enhanced Incremental Heuristic Search on Path PlanningSilin Meng, Yiwei Wang 0001, Cheng-Fu Yang, Nanyun Peng, Kai-Wei Chang. 1087-1102 [doi]

Guided Knowledge Generation with Language Models for Commonsense ReasoningXiao Wei, Haoran Chen, Hang Yu, Hao Fei, Qian Liu. 1103-1136 [doi]

BSharedRAG: Backbone Shared Retrieval-Augmented Generation for the E-commerce DomainKaisi Guan, Qian Cao 0001, Yuchong Sun, Xiting Wang, Ruihua Song. 1137-1158 [doi]

NCPrompt: NSP-Based Prompt Learning and Contrastive Learning for Implicit Discourse Relation RecognitionYuetong Rong, Yijun Mo. 1159-1169 [doi]

SAFETY-J: Evaluating Safety with CritiqueYixiu Liu, Yuxiang Zheng, Shijie Xia, Jiajun Li, Yi Tu, Chaoling Song, Pengfei Liu. 1170-1192 [doi]

Improving Demonstration Diversity by Human-Free Fusing for Text-to-SQLDingzirui Wang, Longxu Dou, Xuanliang Zhang, Qingfu Zhu, Wanxiang Che. 1193-1207 [doi]

A Unified Framework and Dataset for Assessing Societal Bias in Vision-Language ModelsAshutosh Sathe, Prachi Jain, Sunayana Sitaram. 1208-1249 [doi]

Breaking the Boundaries: A Unified Framework for Chinese Named Entity Recognition Across Text and SpeechJinzhong Ning, Yuanyuan Sun, Bo Xu, Zhihao Yang, Ling Luo 0001, Hongfei Lin. 1250-1260 [doi]

VGA: Vision GUI Assistant - Minimizing Hallucinations through Image-Centric Fine-TuningZiyang Meng, Yu Dai, Zezheng Gong, Shaoxiong Guo, Minglong Tang, Tongquan Wei. 1261-1279 [doi]

Understanding the Therapeutic Relationship between Counselors and Clients in Online Text-based Counseling using LLMsAnqi Li, Yu Lu, Nirui Song, Shuai Zhang, Lizhi Ma, Zhenzhong Lan. 1280-1303 [doi]

Dynamic Planning for LLM-based Graphical User Interface AutomationShaoqing Zhang, Zhuosheng Zhang 0001, Kehai Chen, Xinbei Ma, Muyun Yang, Tiejun Zhao, Min Zhang 0005. 1304-1320 [doi]

SeRTS: Self-Rewarding Tree Search for Biomedical Retrieval-Augmented GenerationMinda Hu, Licheng Zong, Hongru Wang 0003, Jingyan Zhou, Jingjing Li 0007, Yichen Gao, Kam-Fai Wong, Yu Li 0006, Irwin King. 1321-1335 [doi]

Large Language Model-based Human-Agent Collaboration for Complex Task SolvingXueyang Feng, Zhiyuan Chen, Yujia Qin, Yankai Lin, Xu Chen 0017, Zhiyuan Liu 0001, Ji-Rong Wen. 1336-1357 [doi]

MM-MATH: Advancing Multimodal Math Evaluation with Process Evaluation and Fine-grained ClassificationKai Sun, Yushi Bai, Ji Qi, Lei Hou 0001, Juan-Zi Li. 1358-1375 [doi]

LongAlign: A Recipe for Long Context Alignment of Large Language ModelsYushi Bai, Xin Lv, Jiajie Zhang, Yuze He, Ji Qi, Lei Hou 0001, Jie Tang 0001, Yuxiao Dong, Juanzi Li. 1376-1395 [doi]

Let's Ask GNN: Empowering Large Language Model for Graph In-Context LearningZhengyu Hu, Yichuan Li 0001, Zhengyu Chen 0001, Jingang Wang, Han Liu, Kyumin Lee, Kaize Ding. 1396-1409 [doi]

CoXQL: A Dataset for Parsing Explanation Requests in Conversational XAI SystemsQianli Wang, Tatiana Anikina, Nils Feldhus, Simon Ostermann 0002, Sebastian Möller 0001. 1410-1422 [doi]

Evaluating Language Model Character TraitsFrancis Rhys Ward, Zejia Yang, Alex Jackson, Randy Brown, Chandler Smith, Grace Colverd, Louis Thomson, Raymond Douglas, Patrik Bartak, Andrew Rowan. 1423-1443 [doi]

Self-Explore: Enhancing Mathematical Reasoning in Language Models with Fine-grained RewardsHyeonbin Hwang, Doyoung Kim, Seungone Kim, Seonghyeon Ye, Minjoon Seo. 1444-1466 [doi]

R-Judge: Benchmarking Safety Risk Awareness for LLM AgentsTongxin Yuan, Zhiwei He 0002, Lingzhong Dong, Yiming Wang, Ruijie Zhao 0001, Tian Xia, Lizhen Xu, Binglin Zhou, Fangqi Li 0001, Zhuosheng Zhang 0001, Rui Wang 0015, Gongshen Liu. 1467-1490 [doi]

EAVE: Efficient Product Attribute Value Extraction via Lightweight Sparse-layer InteractionLi Yang, Qifan Wang, Jianfeng Chi, Jiahao Liu, Jingang Wang, Fuli Feng, Zenglin Xu, Yi Fang 0008, Lifu Huang, Dongfang Liu. 1491-1505 [doi]

MultiSkill: Evaluating Large Multimodal Models for Fine-grained Alignment SkillsZhenran Xu, Senbao Shi, Baotian Hu, Longyue Wang, Min Zhang 0005. 1506-1523 [doi]

To Forget or Not? Towards Practical Knowledge Unlearning for Large Language ModelsBozhong Tian, Xiaozhuan Liang, Siyuan Cheng 0008, Qingbin Liu, Mengru Wang, Dianbo Sui, Xi Chen 0003, Huajun Chen, Ningyu Zhang 0001. 1524-1537 [doi]

EchoSight: Advancing Visual-Language Models with Wiki KnowledgeYibin Yan, Weidi Xie. 1538-1551 [doi]

Diversify, Rationalize, and Combine: Ensembling Multiple QA Strategies for Zero-shot Knowledge-based VQAMiaoyu Li, Haoxin Li, Zilin Du, Boyang Li. 1552-1566 [doi]

Reconfidencing LLMs from the Grouping Loss PerspectiveLihu Chen, Alexandre Perez-Lebel, Fabian M. Suchanek, Gaël Varoquaux. 1567-1581 [doi]

Tokenization Falling Short: On Subword Robustness in Large Language ModelsYekun Chai, Yewei Fang, Qiwei Peng 0002, Xuhong Li 0002. 1582-1599 [doi]

AC-EVAL: Evaluating Ancient Chinese Language Understanding in Large Language ModelsYuting Wei, Yuanxing Xu, Xinru Wei, Simin Yang, Yangfu Zhu, Yuqing Li, Di Liu, Bin Wu. 1600-1617 [doi]

MMAR: Multilingual and Multimodal Anaphora Resolution in Instructional VideosCennet Oguz, Pascal Denis, Simon Ostermann 0002, Emmanuel Vincent 0001, Natalia Skachkova, Josef von Genabith. 1618-1633 [doi]

Dealing with Controversy: An Emotion and Coping Strategy Corpus Based on Role PlayingEnrica Troiano, Sofie Labat, Marco Stranisci, Rossana Damiano, Viviana Patti, Roman Klinger. 1634-1658 [doi]

MATE: Meet At The Embedding - Connecting Images with Long TextsYoung-Kyun Jang, Junmo Kang, Yong Jae Lee, Donghyun Kim. 1659-1672 [doi]

Mixed Distillation Helps Smaller Language Models Reason BetterChenglin Li, Qianglong Chen, Liangyue Li, Caiyu Wang, Feng Tao, Yicheng Li, Zulong Chen, Yin Zhang 0006. 1673-1690 [doi]

The SIFo Benchmark: Investigating the Sequential Instruction Following Ability of Large Language ModelsXinyi Chen, Baohao Liao, Jirui Qi, Panagiotis Eustratiadis, Christof Monz, Arianna Bisazza, Maarten de Rijke. 1691-1706 [doi]

Optimizing Instruction Synthesis: Effective Exploration of Evolutionary Space with Tree SearchChenglin Li, Qianglong Chen, Zhi Li, Feng Tao, Yicheng Li, Hao Chen, Fei Yu, Yin Zhang. 1707-1721 [doi]

Suri: Multi-constraint Instruction Following in Long-form Text GenerationChau Pham, Simeng Sun, Mohit Iyyer. 1722-1753 [doi]

Augmenting Black-box LLMs with Medical Textbooks for Biomedical Question AnsweringYubo Wang, Xueguang Ma, Wenhu Chen. 1754-1770 [doi]

Exploring Multilingual Concepts of Human Values in Large Language Models: Is Value Alignment Consistent, Transferable and Controllable across Languages?Shaoyang Xu, Weilong Dong, Zishan Guo, Xinwei Wu, Deyi Xiong. 1771-1793 [doi]

PaCoST: Paired Confidence Significance Testing for Benchmark Contamination Detection in Large Language ModelsHuixuan Zhang, Yun Lin, Xiaojun Wan 0001. 1794-1809 [doi]

UrbanLLM: Autonomous Urban Activity Planning and Management with Large Language ModelsYue Jiang, Qin Chao, Yile Chen 0001, Xiucheng Li, Shuai Liu, Gao Cong. 1810-1825 [doi]

Breaking the Ceiling of the LLM Community by Treating Token Generation as a Classification for EnsemblingYao-Ching Yu, Chun-Chih Kuo, Ziqi Ye, Yu-Cheng Chang, Yueh-Se Li. 1826-1839 [doi]

Eliciting Instruction-tuned Code Language Models' Capabilities to Utilize Auxiliary Function for Code GenerationSeonghyeon Lee, Suyeon Kim, Joonwon Jang, Heejae Chon, Dongha Lee, Hwanjo Yu. 1840-1846 [doi]

AHP-Powered LLM Reasoning for Multi-Criteria Evaluation of Open-Ended ResponsesXiaotian Lu, Jiyi Li, Koh Takeuchi, Hisashi Kashima. 1847-1856 [doi]

Enhancing Fine-Grained Image Classifications via Cascaded Vision Language ModelsCanshi Wei. 1857-1871 [doi]

Exploring the Best Practices of Query Expansion with Large Language ModelsLe Zhang, Yihong Wu, Qian Yang, Jian-Yun Nie. 1872-1883 [doi]

Chain-of-Rewrite: Aligning Question and Documents for Open-Domain Question AnsweringChunlei Xin, Yaojie Lu 0001, Hongyu Lin, Shuheng Zhou, Huijia Zhu, Weiqiang Wang, Zhongyi Liu, Xianpei Han, Le Sun 0001. 1884-1896 [doi]

MGCL: Multi-Granularity Clue Learning for Emotion-Cause Pair Extraction via Cross-Grained Knowledge DistillationYang Yu, Xin Lin 0001, Changqun Li, Shizhou Huang, Liang He 0001. 1897-1907 [doi]

Efficient Data Generation for Source-grounded Information-seeking Dialogs: A Use Case for Meeting TranscriptsLotem Golany, Filippo Galgani, Maya Mamo, Nimrod Parasol, Omer Vandsburger, Nadav Bar, Ido Dagan. 1908-1925 [doi]

Visual Question Decomposition on Multimodal Large Language ModelsHaowei Zhang, Jianzhe Liu, Zhen Han, Shuo Chen 0014, Bailan He, Volker Tresp, Zhiqiang Xu, Jindong Gu. 1926-1949 [doi]

ProSA: Assessing and Understanding the Prompt Sensitivity of LLMsJingming Zhuo, Songyang Zhang, XinYu Fang, Haodong Duan, Dahua Lin, Kai Chen 0026. 1950-1976 [doi]

Layer-wise Importance Matters: Less Memory for Better Performance in Parameter-efficient Fine-tuning of Large Language ModelsKai Yao, Penglei Gao, Lichun Li, Yuan Zhao, Xiaofeng Wang 0007, Wei Wang 0002, Jianke Zhu. 1977-1992 [doi]

Abstraction-of-Thought Makes Language Models Better ReasonersRuixin Hong, Hongming Zhang 0009, Xiaoman Pan, Dong Yu 0001, Changshui Zhang. 1993-2027 [doi]

LLMs Cannot (Yet) Match the Specificity and Simplicity of Online Communities in Long Form Question AnsweringKris-Fillip Kahl, Tolga Buz, Russa Biswas, Gerard de Melo. 2028-2053 [doi]

Automated Tone Transcription and Clustering with Tone2VecYi Yang, Yiming Wang, ZhiQiang Tang, Jiahong Yuan. 2054-2065 [doi]

Multi-dimensional Evaluation of Empathetic Dialogue ResponsesZhichao Xu, Jiepu Jiang. 2066-2087 [doi]

Translation of Multifaceted Data without Re-Training of Machine Translation SystemsHyeonseok Moon, Seungyoon Lee, Seongtae Hong, Seungjun Lee, Chanjun Park, HeuiSeok Lim. 2088-2108 [doi]

Reward Difference Optimization For Sample Reweighting In Offline RLHFShiqi Wang 0003, Zhengze Zhang, Rui Zhao, Fei Tan, Cam-Tu Nguyen. 2109-2123 [doi]

AgentBank: Towards Generalized LLM Agents via Fine-Tuning on 50000+ Interaction TrajectoriesYifan Song, Weimin Xiong, Xiutian Zhao, Dawei Zhu, Wenhao Wu, Ke Wang, Cheng Li, Wei Peng, Sujian Li. 2124-2141 [doi]

Are LLMs Aware that Some Questions are not Open-ended?Dongjie Yang, Hai Zhao 0001. 2142-2152 [doi]

Conditional Language Policy: A General Framework For Steerable Multi-Objective FinetuningKaiwen Wang, Rahul Kidambi, Ryan Sullivan, Alekh Agarwal, Christoph Dann, Andrea Michi, Marco Gelmi, Yunxuan Li, Raghav Gupta, Kumar Dubey, Alexandre Ramé, Johan Ferret, Geoffrey Cideron, Le Hou, Hongkun Yu 0001, Amr Ahmed 0001, Aranyak Mehta, Léonard Hussenot, Olivier Bachem, Edouard Leurent. 2153-2186 [doi]

DALK: Dynamic Co-Augmentation of LLMs and KG to answer Alzheimer's Disease Questions with Scientific LiteratureDawei Li 0008, Shu Yang, Zhen Tan, Jae Young Baik, Sukwon Yun, Joseph Lee, Aaron Chacko, Bojian Hou, Duy Duong Tran, Ying Ding, Huan Liu 0001, Li Shen 0001, Tianlong Chen. 2187-2205 [doi]

Can AI Relate: Testing Large Language Model Response for Mental Health SupportSaadia Gabriel, Isha Puri, Xuhai Xu, Matteo Malgaroli, Marzyeh Ghassemi. 2206-2221 [doi]

Towards Robust Extractive Question Answering Models: Rethinking the Training MethodologySon Tran, Matt Kretchmar. 2222-2236 [doi]

Enhancing Polyglot Voices by Leveraging Cross-Lingual Fine-Tuning in Any-to-One Voice ConversionGiuseppe Ruggiero, Matteo Testa, Jurgen Van de Walle, Luigi Di Caro. 2237-2246 [doi]

IntentionQA: A Benchmark for Evaluating Purchase Intention Comprehension Abilities of Language Models in E-commerceWenxuan Ding 0001, Weiqi Wang 0001, Sze Heng Douglas Kwok, Minghao Liu, Tianqing Fang, Jiaxin Bai, Xin Liu 0039, Changlong Yu, Zheng Li 0018, Chen Luo 0003, Qingyu Yin, Bing Yin, Junxian He, Yangqiu Song. 2247-2266 [doi]

Draft on the Fly: Adaptive Self-Speculative Decoding using Cosine SimilarityMichael R. Metel, Peng Lu, Boxing Chen, Mehdi Rezagholizadeh, Ivan Kobyzev. 2267-2272 [doi]

EconLogicQA: A Question-Answering Benchmark for Evaluating Large Language Models in Economic Sequential ReasoningYinzhu Quan, Zefang Liu. 2273-2282 [doi]

The Base-Rate Effect on LLM Benchmark Performance: Disambiguating Test-Taking Strategies from Benchmark PerformanceKyle Moore, Jesse Roberts, Thao Pham, Oseremhen Ewaleifoh, Douglas H. Fisher. 2283-2288 [doi]

Can LLM Graph Reasoning Generalize beyond Pattern Memorization?Yizhuo Zhang, Heng Wang 0008, Shangbin Feng, Zhaoxuan Tan, Xiaochuang Han, Tianxing He, Yulia Tsvetkov. 2289-2305 [doi]

Improving Multilingual Instruction Finetuning via Linguistically Natural and Diverse DatasetsSathish Reddy Indurthi, Wenxuan Zhou, Shamil Chollampatt, Ravi Agrawal, Kaiqiang Song, Lingxiao Zhao, Chenguang Zhu. 2306-2323 [doi]

ASTE-Transformer: Modelling Dependencies in Aspect-Sentiment Triplet ExtractionIwo Naglik, Mateusz Lango. 2324-2339 [doi]

Faithful and Plausible Natural Language Explanations for Image Classification: A Pipeline ApproachAdam Wojciechowski, Mateusz Lango, Ondrej Dusek. 2340-2351 [doi]

SynTQA: Synergistic Table-based Question Answering via Mixture of Text-to-SQL and E2E TQASiyue Zhang, Anh Tuan Luu, Chen Zhao. 2352-2364 [doi]

OpenGraph: Towards Open Graph Foundation ModelsLianghao Xia, Ben Kao, Chao Huang 0001. 2365-2379 [doi]

Controlling Risk of Retrieval-augmented Generation: A Counterfactual Prompting FrameworkLu Chen, Ruqing Zhang 0001, Jiafeng Guo, Yixing Fan, Xueqi Cheng. 2380-2393 [doi]

Learning to Paraphrase for Alignment with LLM PreferenceJunbo Fu, Guoshuai Zhao, Yimin Deng, Yunqi Mi, Xueming Qian. 2394-2407 [doi]

Mirror-Consistency: Harnessing Inconsistency in Majority VotingSiyuan Huang 0003, Zhiyuan Ma, Jintao Du, Changhua Meng, Weiqiang Wang, Zhouhan Lin. 2408-2420 [doi]

Adaptive Contrastive Decoding in Retrieval-Augmented Generation for Handling Noisy ContextsYouna Kim, Hyuhng Joon Kim, Cheonbok Park, Choonghyun Park, Hyunsoo Cho, Junyeob Kim, Kang Min Yoo, Sang-goo Lee, Taeuk Kim. 2421-2431 [doi]

AnyTrans: Translate AnyText in the Image with Large Scale ModelsZhipeng Qian, Pei Zhang 0011, Baosong Yang, Kai Fan 0002, Yiwei Ma, Derek F. Wong, Xiaoshuai Sun, Rongrong Ji. 2432-2444 [doi]

In-Context Former: Lightning-fast Compressing Context for Large Language ModelXiangfeng Wang, Zaiyi Chen, Tong Xu 0001, Zheyong Xie, Yongyi He, Enhong Chen. 2445-2460 [doi]

How Alignment and Jailbreak Work: Explain LLM Safety through Intermediate Hidden StatesZhenhong Zhou, Haiyang Yu, Xinghua Zhang, Rongwu Xu, Fei Huang, Yongbin Li. 2461-2488 [doi]

A Coarse-to-Fine Prototype Learning Approach for Multi-Label Few-Shot Intent DetectionXiaotong Zhang 0003, Xinyi Li, Feng Zhang, Zhiyi Wei, Junfeng Liu, Han Liu 0008. 2489-2502 [doi]

Can Large Language Models Understand DL-Lite Ontologies? An Empirical StudyKeyu Wang, Guilin Qi, Jiaqi Li, Songlin Zhai. 2503-2519 [doi]

Enhancing Healthcare LLM Trust with Atypical Presentations RecalibrationJeremy Qin, Bang Liu, Quoc Dinh Nguyen. 2520-2537 [doi]

EvoR: Evolving Retrieval for Code GenerationHongjin Su, Shuyang Jiang, Yuhang Lai, Haoyuan Wu, Boao Shi, Che Liu, Qian Liu, Tao Yu 0009. 2538-2554 [doi]

Head-wise Shareable Attention for Large Language ModelsZouying Cao, Yifei Yang, Hai Zhao 0001. 2555-2571 [doi]

Divide-or-Conquer? Which Part Should You Distill Your LLM?Zhuofeng Wu 0001, Richard He Bai, Aonan Zhang, Jiatao Gu, V. G. Vinod Vydiswaran, Navdeep Jaitly, Yizhe Zhang 0002. 2572-2585 [doi]

Navigating the Shortcut Maze: A Comprehensive Analysis of Shortcut Learning in Text Classification by Language ModelsYuqing Zhou, Ruixiang Tang, Ziyu Yao, Ziwei Zhu 0001. 2586-2614 [doi]

Privacy Evaluation Benchmarks for NLP ModelsWei Huang 0039, Yinggui Wang, Cen Chen. 2615-2636 [doi]

MM-ChatAlign: A Novel Multimodal Reasoning Framework based on Large Language Models for Entity AlignmentXuhui Jiang, Yinghan Shen, ZhiChao Shi, Chengjin Xu, Wei Li, Huang Zihe, Jian Guo, Yuanzhuo Wang. 2637-2654 [doi]

Towards Explainable Computerized Adaptive Testing with Large Language ModelCheng Cheng, Guanhao Zhao, Zhenya Huang, Yan Zhuang, Zhaoyuan Pan, Qi Liu 0003, Xin Li 0064, Enhong Chen. 2655-2672 [doi]

MC-indexing: Effective Long Document Retrieval via Multi-view Content-aware IndexingKuicai Dong, Derrick-Goh-Xin Deik, Yi Lee, Hao Zhang, Xiangyang Li, Cong Zhang, Yong Liu. 2673-2691 [doi]

PSLM: Parallel Generation of Text and Speech with LLMs for Low-Latency Spoken Dialogue SystemsKentaro Mitsui, Koh Mitsuda, Toshiaki Wakatsuki, Yukiya Hono, Kei Sawada. 2692-2700 [doi]

Correct after Answer: Enhancing Multi-Span Question Answering with Post-Processing MethodJiayi Lin, Chenyang Zhang, Haibo Tong, Dongyu Zhang, Qingqing Hong, Bingxuan Hou, Junli Wang. 2701-2717 [doi]

Are Large Language Models (LLMs) Good Social Predictors?Kaiqi Yang, Hang Li 0007, Hongzhi Wen, Tai-Quan Peng, Jiliang Tang, Hui Liu 0031. 2718-2730 [doi]

Bahasa Harmony: A Comprehensive Dataset for Bahasa Text-to-Speech Synthesis with Discrete Codec Modeling of EnGen-TTSOnkar Susladkar, Vishesh Tripathi, Biddwan Ahmed. 2731-2741 [doi]

MINERS: Multilingual Language Models as Semantic RetrieversGenta Indra Winata, Ruochen Zhang, David Ifeoluwa Adelani. 2742-2766 [doi]

BoolQuestions: Does Dense Retrieval Understand Boolean Logic in Language?Zongmeng Zhang, Jinhua Zhu 0001, Wengang Zhou, Xiang Qi, Peng Zhang 0080, Houqiang Li. 2767-2779 [doi]

McCrolin: Multi-consistency Cross-lingual Training for Retrieval Question AnsweringPeerat Limkonchotiwat, Wuttikorn Ponwitayarat, Lalita Lowphansirikul, Potsawee Manakul, Can Udomcharoenchaikit, Ekapol Chuangsuwanich, Sarana Nutanong. 2780-2793 [doi]

A Novel Metric for Measuring the Robustness of Large Language Models in Non-adversarial ScenariosSamuel Ackerman, Ella Rabinovich, Eitan Farchi, Ateret Anaby-Tavor. 2794-2802 [doi]

Learning Musical Representations for Music Performance Question AnsweringXingjian Diao, Chunhui Zhang, Tingxuan Wu, Ming Cheng, Zhongyu Ouyang, Weiyi Wu, Jiang Gui. 2803-2813 [doi]

Transfer Learning for Text Classification via Model Risk AnalysisYujie Sun, Chuyi Fan, Qun Chen. 2814-2825 [doi]

Typos that Broke the RAG's Back: Genetic Attack on RAG Pipeline by Simulating Documents in the Wild via Low-level PerturbationsSukmin Cho, Soyeong Jeong, Jeongyeon Seo, Taeho Hwang, Jong Park. 2826-2844 [doi]

Enhancing Temporal Modeling of Video LLMs via Time GatingZi-Yuan Hu, Yiwu Zhong, Shijia Huang, Michael R. Lyu, Liwei Wang 0009. 2845-2856 [doi]

AlignedCoT: Prompting Large Language Models via Native-Speaking DemonstrationsZhicheng Yang, Yinya Huang, Jing Xiong, Liang Feng, Xiaodan Liang, Yiwei Wang, Jing Tang 0004. 2857-2896 [doi]

On the Empirical Complexity of Reasoning and Planning in LLMsLiwei Kang, Zirui Zhao, David Hsu, Wee Sun Lee. 2897-2936 [doi]

Learning from Mistakes: Iterative Prompt Relabeling for Text-to-Image Diffusion Model TrainingXinyan Chen, Jiaxin Ge, Tianjun Zhang, Jiaming Liu 0003, Shanghang Zhang. 2937-2952 [doi]

Are modern neural ASR architectures robust for polysynthetic languages?Éric Le Ferrand, Zoey Liu, Antti Arppe, Emily Prud'hommeaux. 2953-2963 [doi]

A Notion of Complexity for Theory of Mind via Discrete World ModelsX. Angelo Huang, Emanuele La Malfa, Samuele Marro, Andrea Asperti, Anthony G. Cohn 0001, Michael J. Wooldridge. 2964-2983 [doi]

Learning Dynamic Multi-attribute Interest for Personalized Product SearchYutong Bai, Zhicheng Dou, Ji-Rong Wen. 2984-2993 [doi]

Evaluating Automatic Metrics with Incremental Machine Translation SystemsGuojun Wu, Shay B. Cohen, Rico Sennrich. 2994-3005 [doi]

LLM-Based Offline Learning for Embodied Agents via Consistency-Guided Reward EnsembleYujeong Lee, Sangwoo Shin, Wei-Jin Park, Honguk Woo. 3006-3029 [doi]

Self-Renewal Prompt Optimizing with Implicit ReasoningZiHan Liang, Ben Chen, Zhuoran Ran, Zihan Wang, Huangyu Dai, Yufei Ma 0011, Dehong Gao, Xiaoyan Cai, Libin Yang. 3030-3041 [doi]

Ruler: A Model-Agnostic Method to Control Generated Length for Large Language ModelsJiaming Li, Lei Zhang, Yunshui Li, Ziqiang Liu, Yuelin Bai, Run Luo, Longze Chen, Min Yang 0007. 3042-3059 [doi]

Women Are Beautiful, Men Are Leaders: Gender Stereotypes in Machine Translation and Language ModelingMatús Pikuliak, Stefan Oresko, Andrea Hrckova, Marián Simko. 3060-3083 [doi]

Recent Trends in Linear Text Segmentation: A SurveyIacopo Ghinassi, Lin Wang 0009, Chris Newell, Matthew Purver. 3084-3095 [doi]

mPLUG-DocOwl 1.5: Unified Structure Learning for OCR-free Document UnderstandingAnwen Hu, Haiyang Xu, Jiabo Ye, Ming Yan, Liang Zhang, Bo Zhang 0071, Ji Zhang 0011, Qin Jin, Fei Huang 0004, Jingren Zhou. 3096-3120 [doi]

Exploring Question Guidance and Answer Calibration for Visually Grounded Video Question AnsweringYuanxing Xu, Yuting Wei, Shuai Zhong, Xinming Chen, Jinsheng Qi, Bin Wu. 3121-3133 [doi]

LoRAN: Improved Low-Rank Adaptation by a Non-Linear TransformationYinqiao Li, Linqi Song, Hanxu Hou. 3134-3143 [doi]

Large Language Models are Limited in Out-of-Context Knowledge ReasoningPeng Hu, Changjiang Gao, RuiQi Gao, Jiajun Chen, Shujian Huang. 3144-3155 [doi]

BiKT: Enabling Bidirectional Knowledge Transfer Between Pretrained Models and Sequential Downstream TasksHang Zeng, Chaoyue Niu, Fan Wu 0006, Shaojie Tang 0001, Leihao Pei, Chengfei Lv, Guihai Chen. 3156-3171 [doi]

Double-Checker: Large Language Model as a Checker for Few-shot Named Entity RecognitionWei Chen 0156, Lili Zhao 0002, Zhi Zheng 0008, Tong Xu 0001, Yang Wang, Enhong Chen. 3172-3181 [doi]

Scaling Sentence Embeddings with Large Language ModelsTing Jiang, Shaohan Huang, Zhongzhi Luan, Deqing Wang, Fuzhen Zhuang. 3182-3196 [doi]

Exploring the Relationship between In-Context Learning and Instruction TuningHanyu Duan, Yixuan Tang, Yi Yang 0042, Ahmed Abbasi, Kar Yan Tam. 3197-3210 [doi]

Granular Entity Mapper: Advancing Fine-grained Multimodal Named Entity Recognition and GroundingZiqi Wang, Chen Zhu 0003, Zhi Zheng 0008, Xinhang Li, Tong Xu 0001, Yongyi He, Qi Liu 0003, Ying Yu, Enhong Chen. 3211-3226 [doi]

JobFair: A Framework for Benchmarking Gender Hiring Bias in Large Language ModelsZe Wang, Zekun Wu 0003, Xin Guan, Michael Thaler, Adriano S. Koshiyama, Skylar Lu, Sachin Beepath, Ediz Ertekin Jr., María Pérez-Ortiz 0001. 3227-3246 [doi]

Contrastive Token Learning with Similarity Decay for Repetition Suppression in Machine TranslationHuangyu Dai, Ben Chen, Kaidi Chen, Ying Han, ZiHan Liang, Wen Jiang. 3247-3261 [doi]

A Psycholinguistic Evaluation of Language Models' Sensitivity to Argument RolesEun Kyoung Lee, Sathvik Nair, Naomi Feldman. 3262-3274 [doi]

Tending Towards Stability: Convergence Challenges in Small Language ModelsRichard Diehl Martinez, Pietro Lesci, Paula Buttery. 3275-3286 [doi]

Be a Multitude to Itself: A Prompt Evolution Framework for Red TeamingRui Li, Peiyi Wang, Jingyuan Ma, Di Zhang, Lei Sha, Zhifang Sui. 3287-3301 [doi]

Modeling News Interactions and Influence for Financial Market PredictionMengyu Wang, Shay Cohen, Tiejun Ma. 3302-3314 [doi]

Multi-Stage Balanced Distillation: Addressing Long-Tail Challenges in Sequence-Level Knowledge DistillationYuhang Zhou, Jing Zhu 0005, Paiheng Xu, Xiaoyu Liu 0003, Xiyao Wang, Danai Koutra, Wei Ai 0002, Furong Huang. 3315-3333 [doi]

Are Large Vision Language Models up to the Challenge of Chart Comprehension and ReasoningMohammed Saidul Islam, Raian Rahman, Ahmed Masry, Md. Tahmid Rahman Laskar, Mir Tafseer Nayeem, Enamul Hoque. 3334-3368 [doi]

HoneyComb: A Flexible LLM-Based Agent System for Materials ScienceHuan Zhang, Yu Song, Ziyu Hou, Santiago Miret, Bang Liu. 3369-3382 [doi]

Revealing COVID-19's Social Dynamics: Diachronic Semantic Analysis of Vaccine and Symptom Discourse on TwitterZeqiang Wang, Jiageng Wu, Yuqi Wang, Wei Xjtlu, Jie Yang, Nishanth Sastry, Jon Johnson, Suparna De. 3383-3394 [doi]

Divide and Conquer: Legal Concept-guided Criminal Court View GenerationQi Xu, Xiao Wei 0002, Hang Yu 0006, Qian Liu 0012, Hao Fei 0001. 3395-3410 [doi]

Data Diversity Matters for Robust Instruction TuningAlexander Bukharin, Shiyang Li, Zhengyang Wang, Jingfeng Yang 0001, Bing Yin, Xian Li, Chao Zhang 0014, Tuo Zhao, Haoming Jiang. 3411-3425 [doi]

GE2PE: Persian End-to-End Grapheme-to-Phoneme ConversionElnaz Rahmati, Hossein Sameti. 3426-3436 [doi]

Characterizing LLM Abstention Behavior in Science QA with Context PerturbationsBingbing Wen, Bill Howe, Lucy Lu Wang. 3437-3450 [doi]

Plausibly Problematic Questions in Multiple-Choice Benchmarks for Commonsense ReasoningShramay Palta, Nishant Balepur, Peter Rankel, Sarah Wiegreffe, Marine Carpuat, Rachel Rudinger. 3451-3473 [doi]

Cost-Efficient Subjective Task Annotation and Modeling through Few-Shot Annotator AdaptationPreni Golazizian, Alireza Salkhordeh Ziabari, Ali Omrani, Morteza Dehghani. 3474-3491 [doi]

EDEN: Empathetic Dialogues for English LearningSiyan Li, Teresa Shao, Zhou Yu, Julia Hirschberg. 3492-3511 [doi]

Language Models Still Struggle to Zero-shot Reason about Time SeriesMike A. Merrill, Mingtian Tan, Vinayak Gupta, Thomas Hartvigsen, Tim Althoff. 3512-3533 [doi]

Enhancing Agent Learning through World Dynamics ModelingZhiyuan Sun, Haochen Shi, Marc-Alexandre Côté, Glen Berseth, Xingdi Yuan, Bang Liu. 3534-3568 [doi]

NormTab: Improving Symbolic Reasoning in LLMs Through Tabular Data NormalizationMd Mahadi Hasan Nahid, Davood Rafiei. 3569-3585 [doi]

Zero-Resource Hallucination Prevention for Large Language ModelsJunyu Luo 0001, Cao Xiao, Fenglong Ma. 3586-3602 [doi]

Measuring and Improving Attentiveness to Partial Inputs with CounterfactualsYanai Elazar, Bhargavi Paranjape, Hao Peng 0009, Sarah Wiegreffe, Khyathi Raghavi Chandu, Vivek Srikumar, Sameer Singh 0001, Noah A. Smith. 3603-3623 [doi]

LaRS: Latent Reasoning Skills for Chain-of-Thought ReasoningZifan Xu, Haozhu Wang, Dmitriy Bespalov, Xian Wu, Peter Stone, Yanjun Qi. 3624-3643 [doi]

TROPE: TRaining-Free Object-Part Enhancement for Seamlessly Improving Fine-Grained Zero-Shot Image CaptioningJoshua Feinglass, Yezhou Yang. 3644-3655 [doi]

The Craft of Selective Prediction: Towards Reliable Case Outcome Classification - An Empirical Study on European Court of Human Rights CasesT. Y. S. S. Santosh, Irtiza Chowdhury, Shanshan Xu, Matthias Grabmair. 3656-3674 [doi]

InfuserKI: Enhancing Large Language Models with Knowledge Graphs via Infuser-Guided Knowledge IntegrationFali Wang, Runxue Bao, Suhang Wang, Wenchao Yu, Yanchi Liu, Wei Cheng 0002, Haifeng Chen. 3675-3688 [doi]

SummaCoz: A Dataset for Improving the Interpretability of Factual Consistency Detection for SummarizationGe Luo 0002, Weisi Fan, Miaoran Li, Guoruizhe Sun, Runlong Zhang, Chenyu Xu, Forrest Sheng Bao. 3689-3702 [doi]

Precision or Recall? An Analysis of Image Captions for Training Text-to-Image Generation ModelSheng Cheng, Maitreya Patel, Yezhou Yang. 3703-3709 [doi]

Deciphering the Factors Influencing the Efficacy of Chain-of-Thought: Probability, Memorization, and Noisy ReasoningAkshara Prabhakar, Thomas L. Griffiths 0001, R. Thomas McCoy. 3710-3724 [doi]

Self-contradictory reasoning evaluation and detectionZiyi Liu, Soumya Sanyal 0001, Isabelle Lee, Yongkang Du, Rahul Gupta, Yang Liu, Jieyu Zhao. 3725-3742 [doi]

Incorporating Precedents for Legal Judgement Prediction on European Court of Human Rights CasesT. Y. S. S. Santosh, Mohamed Hesham Elganayni, Stanislaw Sójka, Matthias Grabmair. 3743-3750 [doi]

Molecular Facts: Desiderata for Decontextualization in LLM Fact VerificationAnisha Gunjal, Greg Durrett. 3751-3768 [doi]

MoleculeQA: A Dataset to Evaluate Factual Accuracy in Molecular ComprehensionXingyu Lu, He Cao, Zijing Liu, Shengyuan Bai, Leqing Chen, Yuan Yao 0013, Hai-Tao Zheng 0002, Yu Li. 3769-3789 [doi]

Sanitizing Large Language Models in Bug Detection with Data-FlowChengpeng Wang, Wuqi Zhang, Zian Su, Xiangzhe Xu, Xiangyu Zhang 0001. 3790-3805 [doi]

Scaling Behavior for Large Language Models regarding Numeral Systems: An Example using PythiaZhejian Zhou, Jiayu Wang, Dahua Lin, Kai Chen 0026. 3806-3820 [doi]

When and Where Did it Happen? An Encoder-Decoder Model to Identify Scenario ContextEnrique Noriega-Atala, Robert Vacareanu, Salena Ashton, Adarsh Pyarelal, Clayton T. Morrison, Mihai Surdeanu. 3821-3829 [doi]

Enhancing Incremental Summarization with Structured RepresentationsEunJeong Hwang, Yichao Zhou 0001, James B. Wendt, Beliz Gunel, Nguyen Vo, Jing Xie 0002, Sandeep Tata. 3830-3842 [doi]

Med-MoE: Mixture of Domain-Specific Experts for Lightweight Medical Vision-Language ModelsSongtao Jiang, Tuo Zheng, Yan Zhang 0004, Yeying Jin, Li Yuan, Zuozhu Liu. 3843-3860 [doi]

Multiple Knowledge-Enhanced Interactive Graph Network for Multimodal Conversational Emotion RecognitionGeng Tu, Jun Wang, Zhenyu Li, Shiwei Chen, Bin Liang, Xi Zeng, Min Yang, Ruifeng Xu. 3861-3874 [doi]

AutoRAG-HP: Automatic Online Hyper-Parameter Tuning for Retrieval-Augmented GenerationJia Fu, Xiaoting Qin, Fangkai Yang, Lu Wang 0008, Jue Zhang, Qingwei Lin, Yubo Chen 0001, Dongmei Zhang 0001, Saravan Rajmohan, Qi Zhang. 3875-3891 [doi]

Unleashing the Potential of Large Language Models through Spectral ModulationPeng Sun, Yao Zhu, Yunjian Zhang, Xiu Yan, Zizhe Wang, Xiangyang Ji. 3892-3911 [doi]

LinguAlchemy: Fusing Typological and Geographical Elements for Unseen Language GeneralizationMuhammad Farid Adilazuarda, Samuel Cahyawijaya, Genta Indra Winata, Ayu Purwarianti, Alham Fikri Aji. 3912-3928 [doi]

QUEST: Efficient Extreme Multi-Label Text Classification with Large Language Models on Commodity HardwareChuang Zhou 0002, Junnan Dong, Xiao Huang 0001, Zirui Liu 0001, Kaixiong Zhou, Zhaozhuo Xu. 3929-3940 [doi]

UniSumEval: Towards Unified, Fine-grained, Multi-dimensional Summarization Evaluation for LLMsYuho Lee, Taewon Yun, Jason Cai, Hang Su, Hwanjun Song. 3941-3960 [doi]

Enhancing Arguments Recognition for Financial Mathematical Reasoning over Hybrid DataJinsu Lim, Yechan Hwang, Young-Jun Lee, Ho-Jin Choi. 3961-3973 [doi]

Bi-DCSpell: A Bi-directional Detector-Corrector Interactive Framework for Chinese Spelling CheckHaiming Wu, Hanqing Zhang, Richeng Xuan, Dawei Song 0001. 3974-3984 [doi]

CLongEval: A Chinese Benchmark for Evaluating Long-Context Large Language ModelsZexuan Qiu, Jingjing Li 0007, Shijue Huang, Xiaoqi Jiao, Wanjun Zhong, Irwin King. 3985-4004 [doi]

Guided Profile Generation Improves Personalization with Large Language ModelsJiarui Zhang. 4005-4016 [doi]

mABC: Multi-Agent Blockchain-inspired Collaboration for Root Cause Analysis in Micro-Services ArchitectureWei Zhang, Hongcheng Guo, Jian Yang, Zhoujin Tian, Yi Zhang, Chaoran Yan, Zhoujun Li, Tongliang Li, Xu Shi, Liangfan Zheng, Bo Zhang. 4017-4033 [doi]

Taking a Deep Breath: Enhancing Language Modeling of Large Language Models with Sentinel TokensWeiyao Luo, Suncong Zheng, Heming Xia, Weikang Wang, Yan Lei, Tianyu Liu, Shuang Chen, Zhifang Sui. 4034-4040 [doi]

Reward Modeling Requires Automatic Adjustment Based on Data QualityBinghai Wang, Rui Zheng, Lu Chen, Zhiheng Xi, Wei Shen, Yuhao Zhou, Dong Yan, Tao Gui, Qi Zhang 0001, Xuanjing Huang 0001. 4041-4064 [doi]

LOOK-M: Look-Once Optimization in KV Cache for Efficient Multimodal Long-Context InferenceZhongwei Wan, Ziang Wu, Che Liu, Jinfa Huang, Zhihong Zhu, Peng Jin 0001, Longyue Wang, Li Yuan 0007. 4065-4078 [doi]

The Fall of ROME: Understanding the Collapse of LLMs in Model EditingWanli Yang, Fei Sun 0001, Jiajun Tan, Xinyu Ma, Du Su, Dawei Yin, Huawei Shen. 4079-4087 [doi]

OneGen: Efficient One-Pass Unified Generation and Retrieval for LLMsJintian Zhang, Cheng Peng, Mengshu Sun, Xiang Chen 0016, Lei Liang, Zhiqiang Zhang 0012, Jun Zhou 0011, Huajun Chen, Ningyu Zhang 0001. 4088-4119 [doi]

Self-Evolution Fine-Tuning for Policy OptimizationRuiJun Chen, Jiehao Liang, Shiping Gao, Fanqi Wan, Xiaojun Quan. 4120-4137 [doi]

Deeper Insights Without Updates: The Power of In-Context Learning Over Fine-TuningQingyu Yin, Xuzheng He, Chak Tou Leong, Fan Wang, Yanzhao Yan, Xiaoyu Shen, Qiang Zhang 0026. 4138-4151 [doi]

Adaptive Feature-based Low-Rank Compression of Large Language Models via Bayesian OptimizationYixin Ji, Yang Xiang, Juntao Li, Qingrong Xia, Zi Ye, Xinyu Duan, Zhefeng Wang 0001, Kehai Chen, Min Zhang 0005. 4152-4168 [doi]

Emosical: An Emotion-Annotated Musical Theatre DatasetHayoon Kim, Ahyeon Choi, Sungho Lee, Hyun Jung, Kyogu Lee. 4169-4180 [doi]

Inference-Time Language Model Alignment via Integrated Value GuidanceZhixuan Liu, Zhanhui Zhou, Yuanfu Wang, Chao Yang, Yu Qiao. 4181-4195 [doi]

TongGu: Mastering Classical Chinese Understanding with Knowledge-Grounded Large Language ModelsJiahuan Cao, Dezhi Peng, Peirong Zhang, Yongxin Shi, Yang Liu, Kai Ding 0009, Lianwen Jin. 4196-4210 [doi]

NegotiationToM: A Benchmark for Stress-testing Machine Theory of Mind on Negotiation SurroundingChunkit Chan, Cheng Jiayang, Yauwai Yim, Zheye Deng, Wei Fan, Haoran Li 0003, Xin Liu 0039, Hongming Zhang 0009, Weiqi Wang 0001, Yangqiu Song. 4211-4241 [doi]

A Robust Dual-debiasing VQA Model based on Counterfactual Causal EffectLingyun Song, Chengkun Yang, Xuanyu Li, Xuequn Shang. 4242-4252 [doi]

PyramidCodec: Hierarchical Codec for Long-form Music Generation in Audio DomainJianyi Chen, Zheqi Dai, Zhen Ye, Xu Tan 0003, Qifeng Liu, Yike Guo, Wei Xue. 4253-4263 [doi]

Beyond Persuasion: Towards Conversational Recommender System with Credible ExplanationsPeixin Qin, Chen Huang, Yang Deng 0002, Wenqiang Lei, Tat-Seng Chua. 4264-4282 [doi]

Revisiting Query Variation Robustness of Transformer ModelsTim Hagen, Harrisen Scells, Martin Potthast. 4283-4296 [doi]

Revisiting Catastrophic Forgetting in Large Language Model TuningHongYu Li, Liang Ding 0006, Meng Fang, Dacheng Tao. 4297-4308 [doi]

M5 - A Diverse Benchmark to Assess the Performance of Large Multimodal Models Across Multilingual and Multicultural Vision-Language TasksFlorian Schneider, Sunayana Sitaram. 4309-4345 [doi]

Divine LLaMAs: Bias, Stereotypes, Stigmatization, and Emotion Representation of Religion in Large Language ModelsFlor Miriam Plaza del Arco, Amanda Cercas Curry, Susanna Paoli, Alba Cercas Curry, Dirk Hovy. 4346-4366 [doi]

Boosting Large Language Models with Continual Learning for Aspect-based Sentiment AnalysisXuanwen Ding, Jie Zhou 0015, Liang Dou, Qin Chen, Yuanbin Wu, Arlene Chen, Liang He 0001. 4367-4377 [doi]

ProTrix: Building Models for Planning and Reasoning over Tables with Sentence ContextZirui Wu, Yansong Feng 0002. 4378-4406 [doi]

Recent Advances in Online Hate Speech Moderation: Multimodality and the Role of Large ModelsMing Shan Hee, Shivam Sharma, Rui Cao 0002, Palash Nandi, Preslav Nakov, Tanmoy Chakraborty 0002, Roy Ka-Wei Lee. 4407-4419 [doi]

Quantifying Generative Media Bias with a Corpus of Real-world and Generated News ArticlesFilip Trhlík, Pontus Stenetorp. 4420-4445 [doi]

OEE-CFC: A Dataset for Open Event Extraction from Chinese Financial CommentaryQizhi Wan, Changxuan Wan, Rong Hu, Dexi Liu, Xu Wenwu, Kang Xu, Zou Meihua, Liu Tao, Jie Yang, Zhenwei Xiong. 4446-4459 [doi]

Graph-tree Fusion Model with Bidirectional Information Propagation for Long Document ClassificationSudipta Singha Roy, Xindi Wang, Robert E. Mercer, Frank Rudzicz. 4460-4470 [doi]

BookWorm: A Dataset for Character Description and AnalysisArgyrios Papoudakis, Mirella Lapata, Frank Keller. 4471-4500 [doi]

Leveraging Grammar Induction for Language Understanding and GenerationJushi Kai, Shengyuan Hou, Yusheng Huang, Zhouhan Lin. 4501-4513 [doi]

SH2: Self-Highlighted Hesitation Helps You Decode More TruthfullyJushi Kai, Tianhang Zhang, Hai Hu, Zhouhan Lin. 4514-4530 [doi]

RoQLlama: A Lightweight Romanian Adapted Language ModelGeorge-Andrei Dima, Andrei-Marius Avram, Cristian-George Craciun, Dumitru-Clementin Cercel. 4531-4541 [doi]

Reference-free Hallucination Detection for Large Vision-Language ModelsQing Li 0038, Jiahui Geng, Chenyang Lyu, Derui Zhu, Maxim Panov, Fakhri Karray. 4542-4551 [doi]

WavLLM: Towards Robust and Adaptive Speech Large Language ModelShujie Hu, Long Zhou, Shujie Liu 0001, Sanyuan Chen, Lingwei Meng, Hongkun Hao, Jing Pan, Xunying Liu, Jinyu Li 0001, Sunit Sivasankaran, Linquan Liu, Furu Wei. 4552-4572 [doi]

Learning from Implicit User Feedback, Emotions and Demographic Information in Task-Oriented and Document-Grounded DialoguesDominic Petrak, Thy Thy Tran, Iryna Gurevych. 4573-4603 [doi]

Improving Argument Effectiveness Across Ideologies using Instruction-tuned Large Language ModelsRoxanne El Baff, Khalid Al Khatib, Milad Alshomary, Kai Konen, Benno Stein 0001, Henning Wachsmuth. 4604-4622 [doi]

KV Cache Compression, But What Must We Give in Return? A Comprehensive Benchmark of Long Context Capable ApproachesJiayi Yuan, Hongyi Liu, Shaochen Zhong, Yu-Neng Chuang, Songchen Li, Guanchu Wang, Duy Le, Hongye Jin, Vipin Chaudhary, Zhaozhuo Xu, Zirui Liu 0001, Xia Ben Hu. 4623-4648 [doi]

An Evaluation Mechanism of LLM-based Agents on Manipulating APIsBing Liu, Jianxiang Zhou, Dan Meng, Haonan Lu. 4649-4662 [doi]

Math-LLaVA: Bootstrapping Mathematical Reasoning for Multimodal Large Language ModelsWenhao Shi, Zhiqiang Hu, Yi Bin, Junhua Liu, Yang Yang 0002, See-Kiong Ng, Lidong Bing, Roy Ka-Wei Lee. 4663-4680 [doi]

Navigating the Nuances: A Fine-grained Evaluation of Vision-Language NavigationZehao Wang, Minye Wu, Yixin Cao 0002, Yubo Ma, Meiqi Chen 0001, Tinne Tuytelaars. 4681-4704 [doi]

Re-Invoke: Tool Invocation Rewriting for Zero-Shot Tool RetrievalYanfei Chen, Jinsung Yoon, Devendra Singh Sachan, Qingze Wang, Vincent Cohen-Addad, MohammadHossein Bateni, Chen-Yu Lee, Tomas Pfister. 4705-4726 [doi]

Rethinking Evaluation Methods for Machine UnlearningLeon Wichert, Sandipan Sikdar. 4727-4739 [doi]

Evaluating Moral Beliefs across LLMs through a Pluralistic FrameworkXuelin Liu, Yanfei Zhu, Shucheng Zhu, Pengyuan Liu, Ying Liu, Dong Yu. 4740-4760 [doi]

Knowledge Editing in Language Models via Adapted Direct Preference OptimizationAmit Rozner, Barak Battash, Lior Wolf, Ofir Lindenbaum. 4761-4774 [doi]

Disentangling Questions from Query Generation for Task-Adaptive RetrievalYoonsang Lee 0004, Minsoo Kim, Seung-won Hwang. 4775-4785 [doi]

Reap the Wild Wind: Detecting Media Storms in Large-Scale News CorporaDror K. Markus, Effi Levi, Tamir Sheafer, Shaul R. Shenhav. 4786-4797 [doi]

A Survey on Natural Language Counterfactual GenerationYongJie Wang, Xiaoqi Qiu, Yu Yue, Xu Guo 0002, Zhiwei Zeng, Yuhong Feng, Zhiqi Shen 0001. 4798-4818 [doi]

Geneverse: A Collection of Open-source Multimodal Large Language Models for Genomic and Proteomic ResearchTianyu Liu, Yijia Xiao, Xiao Luo 0001, Hua Xu 0001, Wenjin Jim Zheng, Hongyu Zhao. 4819-4836 [doi]

QRMeM: Unleash the Length Limitation through Question then Reflection Memory MechanismBo Wang, Heyan Huang, Yixin Cao 0002, Jiahao Ying, Wei Tang 0015, Chong Feng. 4837-4851 [doi]

LONG²RAG: Evaluating Long-Context & Long-Form Retrieval-Augmented Generation with Key Point RecallZehan Qi, Rongwu Xu, Zhijiang Guo, Cunxiang Wang, Hao Zhang, Wei Xu. 4852-4872 [doi]

IndoCL: Benchmarking Indonesian Language Development AssessmentNankai Lin, Hongyan Wu, Weixiong Zheng, Xingming Liao, Shengyi Jiang, Aimin Yang, Lixian Xiao. 4873-4885 [doi]

Context-Driven Index Trimming: A Data Quality Perspective to Enhancing Precision of RALMsKexin Ma, Ruochun Jin, Haotian Wang 0001, Xi Wang, Huan Chen, Yuhua Tang, Qian Wang. 4886-4901 [doi]

Counter Turing Test (CT²): Investigating AI-Generated Text Detection for Hindi - Ranking LLMs based on Hindi AI Detectability Index (ADI_hi)Ishan Kavathekar, Anku Rani, Ashmit Chamoli, Ponnurangam Kumaraguru, Amit Sheth 0001, Amitava Das. 4902-4926 [doi]

Generating Media Background Checks for Automated Source Critical ReasoningMichael Schlichtkrull. 4927-4947 [doi]

In Defense of Structural Sparse Adapters for Concurrent LLM ServingJunda Su, Zirui Liu, Zeju Qiu, Weiyang Liu, Zhaozhuo Xu. 4948-4953 [doi]

CONSTRUCTURE: Benchmarking CONcept STRUCTUre REasoning for Multimodal Large Language ModelsZhiwei Zha, Xiangru Zhu, Yuanyi Xu, Chenghua Huang, JingPing Liu, Zhixu Li, Xuwu Wang, Yanghua Xiao, Bei Yang, Xiaoxiao Xu. 4954-4968 [doi]

Stanceformer: Target-Aware Transformer for Stance DetectionKrishna Garg, Cornelia Caragea. 4969-4984 [doi]

Learning Autonomous Driving Tasks via Human Feedbacks with Large Language ModelsYunsheng Ma, Xu Cao, Wenqian Ye, Can Cui, Kai Mei, Ziran Wang. 4985-4995 [doi]

CultureBank: An Online Community-Driven Knowledge Base Towards Culturally Aware Language TechnologiesWeiyan Shi, Ryan Li, Yutong Zhang, Caleb Ziems, Sunny Yu, Raya Horesh, Rogério de Paula, Diyi Yang. 4996-5025 [doi]

TOOLVERIFIER: Generalization to New Tools via Self-VerificationDheeraj Mekala, Jason Weston, Jack Lanchantin, Roberta Raileanu, Maria Lomeli, Jingbo Shang, Jane Dwivedi-Yu. 5026-5041 [doi]

FaithScore: Fine-grained Evaluations of Hallucinations in Large Vision-Language ModelsLiqiang Jing, Ruosen Li, Yunmo Chen, Xinya Du. 5042-5063 [doi]

Learning to Ask Informative Questions: Enhancing LLMs with Preference Optimization and Expected Information GainDavide Mazzaccara, Alberto Testoni, Raffaella Bernardi. 5064-5074 [doi]

Adversarial Math Word Problem GenerationRoy Xie, Chengxuan Huang, Junlin Wang, Bhuwan Dhingra. 5075-5093 [doi]

Defending Large Language Models Against Jailbreak Attacks via Layer-specific EditingWei Zhao, Zhe Li, Yige Li, Ye Zhang, Jun Sun 0001. 5094-5109 [doi]

Promoting Constructive Deliberation: Reframing for ReceptivenessGauri Kambhatla, Matthew Lease, Ashwin Rajadesingan. 5110-5132 [doi]

A Simple but Effective Approach to Improve Structured Language Model Output for Information ExtractionYinghao Li, Rampi Ramprasad, Chao Zhang 0014. 5133-5148 [doi]

Rater Cohesion and Quality from a Vicarious PerspectiveDeepak Pandita, Tharindu Cyril Weerasooriya, Sujan Dutta, Sarah Luger, Tharindu Ranasinghe, Ashiqur R. KhudaBukhsh, Marcos Zampieri, Christopher Homan. 5149-5162 [doi]

Shall We Team Up: Exploring Spontaneous Cooperation of Competing LLM AgentsZengqing Wu, Run Peng, Shuyuan Zheng, Qianying Liu, Xu Han, Brian Inhyuk Kwon, Makoto Onizuka, Shaojie Tang 0001, Chuan Xiao 0001. 5163-5186 [doi]

Normalized Narrow Jump To Conclusions: Normalized Narrow Shortcuts for Parameter Efficient Early Exit Transformer PredictionAmrit Diggavi Seshadri. 5187-5192 [doi]

From Test-Taking to Test-Making: Examining LLM Authoring of Commonsense Assessment ItemsMelissa Roemmele, Andrew Gordon. 5193-5203 [doi]

"I Never Said That": A dataset, taxonomy and baselines on response clarity classificationKonstantinos Thomas, Giorgos Filandrianos, Maria Lymperaiou, Chrysoula Zerva, Giorgos Stamou. 5204-5233 [doi]

Immunization against harmful fine-tuning attacksDomenic Rosati, Jan Wehner, Kai Williams, Lukasz Bartoszcze, Hassan Sajjad 0001, Frank Rudzicz. 5234-5247 [doi]

UniMEEC: Towards Unified Multimodal Emotion Recognition and Emotion CauseGuimin Hu, Zhihong Zhu, Daniel Hershcovich, Lijie Hu, Hasti Seifi, Jiayuan Xie. 5248-5261 [doi]

CodeFort: Robust Training for Code Generation ModelsYuhao Zhang, Shiqi Wang 0002, Haifeng Qian, Zijian Wang 0002, Mingyue Shang, Linbo Liu, Sanjay Krishna Gouda, Baishakhi Ray, Murali Krishna Ramanathan, Xiaofei Ma 0001, Anoop Deoras. 5262-5277 [doi]

MP-RNA: Unleashing Multi-species RNA Foundation Model via Calibrated Secondary Structure PredictionHeng Yang, Ke Li. 5278-5296 [doi]

"Any Other Thoughts, Hedgehog?" Linking Deliberation Chains in Collaborative DialoguesAbhijnan Nath, Videep Venkatesha, Mariah Bradford, Avyakta Chelle, Austin Youngren, Carlos Mabrey, Nathaniel Blanchard, Nikhil Krishnaswamy. 5297-5314 [doi]

Evaluation of Question Answer Generation for Portuguese: Insights and DatasetsFelipe Paula, Cassiana Michelin, Viviane P. Moreira. 5315-5327 [doi]

Evolutionary Contrastive Distillation for Language Model AlignmentJulian Katz-Samuels, Zheng Li, Hyokun Yun, Priyanka Nigam, Yi Xu, Vaclav Petricek, Bing Yin, Trishul Chilimbi. 5328-5345 [doi]

A Fairness-Driven Method for Learning Human-Compatible Negotiation StrategiesRyan Shea, Zhou Yu 0005. 5346-5370 [doi]

Using RL to Identify Divisive Perspectives Improves LLMs Abilities to Identify Communities on Social MediaNikhil Mehta 0003, Dan Goldwasser. 5371-5390 [doi]

Are LLMs Effective Negotiators? Systematic Evaluation of the Multifaceted Capabilities of LLMs in Negotiation DialoguesDeuksin Kwon, Emily Weiss, Tara Kulshrestha, Kushal Chawla, Gale M. Lucas, Jonathan Gratch. 5391-5413 [doi]

When Raw Data Prevails: Are Large Language Model Embeddings Effective in Numerical Data Representation for Medical Machine Learning Applications?Yanjun Gao, Skatje Myers, Shan Chen, Dmitriy Dligach, Timothy A. Miller, Danielle S. Bitterman, Matthew M. Churpek, Majid Afshar. 5414-5428 [doi]

Losing Visual Needles in Image Haystacks: Vision Language Models are Easily Distracted in Short and Long ContextsAditya Sharma, Michael Saxon, William Yang Wang. 5429-5451 [doi]

Calibrating LLMs with Preference Optimization on Thought Trees for Generating Rationale in Science Question ScoringJiazheng Li 0002, Hainiu Xu, Zhaoyue Sun, Yuxiang Zhou, David West, Cesare Aloisi, Yulan He 0001. 5452-5479 [doi]

LOCR: Location-Guided Transformer for Optical Character RecognitionYu Sun, Dongzhan Zhou, Chen Lin 0003, Conghui He, Wanli Ouyang, Han-Sen Zhong. 5480-5497 [doi]

Sing it, Narrate it: Quality Musical Lyrics TranslationZhuorui Ye, Jinhan Li, Rongwu Xu. 5498-5520 [doi]

Exploring Automated Keyword Mnemonics Generation with Large Language Models via Overgenerate-and-RankJaewook Lee 0006, Hunter McNichols, Andrew S. Lan. 5521-5542 [doi]

Dual-teacher Knowledge Distillation for Low-frequency Word TranslationYifan Guo, Hongying Zan, Hongfei Xu. 5543-5552 [doi]

A Simple Angle-based Approach for Contrastive Learning of Unsupervised Sentence RepresentationYoo Hyun Jeong, Myeong Soo Han, Dong-Kyu Chae. 5553-5572 [doi]

Developing a Pragmatic Benchmark for Assessing Korean Legal Language Understanding in Large Language ModelsKimyeeun Kimyeeun, Choi Youngrok, Eunkyung Choi, Jinhwan Choi, Hai Jin Park, Wonseok Hwang. 5573-5595 [doi]

Visual Pivoting Unsupervised Multimodal Machine Translation in Low-Resource Distant Language PairsTurghun Tayir, Lin Li 0001, Xiaohui Tao 0001, Mieradilijiang Maimaiti, Ming Li, Jianquan Liu. 5596-5607 [doi]

Scalable Fine-tuning from Multiple Data Sources: A First-Order Approximation ApproachDongyue Li, Ziniu Zhang, Lu Wang, Hongyang Zhang. 5608-5623 [doi]

In-Context Learning May Not Elicit Trustworthy Reasoning: A-Not-B Errors in Pretrained Language ModelsPengrui Han, Peiyang Song, Haofei Yu, Jiaxuan You. 5624-5643 [doi]

MathFish: Evaluating Language Model Math Reasoning via Grounding in Educational CurriculaLi Lucy, Tal August, Rose E. Wang, Luca Soldaini, Courtney Allison, Kyle Lo. 5644-5673 [doi]

Enhancing Multi-Label Text Classification under Label-Dependent Noise: A Label-Specific Denoising FrameworkPengyu Xu, Liping Jing, Jian Yu 0001. 5674-5688 [doi]

Automatic Reconstruction of Ancient Chinese PronunciationsZhige Huang, Haoan Jin, Mengyue Wu, Kenny Q. Zhu. 5689-5698 [doi]

Instance-Level Dynamic LoRAs Composition for Cross-Task GeneralizationZhiqi Wang, Shizhu He, Kang Liu, Jun Zhao. 5699-5708 [doi]

LongWanjuan: Towards Systematic Measurement for Long Text QualityXiaoran Liu, Kai Lv, Qipeng Guo, Hang Yan 0001, Conghui He, Xipeng Qiu, Dahua Lin. 5709-5725 [doi]

Large Language Model for Multi-Domain Translation: Benchmarking and Domain CoT Fine-tuningTianxiang Hu, Pei Zhang 0011, Baosong Yang, Jun Xie, Derek F. Wong, Rui Wang 0015. 5726-5746 [doi]

TriageAgent: Towards Better Multi-Agents Collaborations for Large Language Model-Based Clinical TriageMeng Lu, Brandon Ho, Dennis Ren, Xuan Wang. 5747-5764 [doi]

Generative Deduplication For Socia Media Data SelectionXianming Li, Jing Li. 5765-5776 [doi]

Gender Bias in Decision-Making with Large Language Models: A Study of Relationship ConflictsSharon Levy, William D. Adler, Tahilin Sanchez Karver, Mark Dredze, Michelle R. Kaufman. 5777-5800 [doi]

Evaluating Biases in Context-Dependent Sexual and Reproductive Health QuestionsSharon Levy, Tahilin Sanchez Karver, William D. Adler, Michelle R. Kaufman, Mark Dredze. 5801-5812 [doi]

Self-Evaluation of Large Language Model based on Glass-box FeaturesHui Huang, Yingqi Qu, Jing Liu, Muyun Yang, Bing Xu, Tiejun Zhao, Wenpeng Lu. 5813-5820 [doi]

FASTTRACK: Reliable Fact Tracing via Clustering and LLM-Powered Evidence ValidationSi Chen, Feiyang Kang, Ning Yu, Ruoxi Jia 0001. 5821-5836 [doi]

PKAD: Pretrained Knowledge is All You Need to Detect and Mitigate Textual Backdoor AttacksYu Chen, Qi Cao, Kaike Zhang, Xuchao Liu, Huawei Shen. 5837-5849 [doi]

Merely Judging Metaphor is Not Enough: Research on Reasonable Metaphor DetectionPuli Chen, Cheng Yang, Qingbao Huang. 5850-5860 [doi]

Can we teach language models to gloss endangered languages?Michael Ginn, Mans Hulden, Alexis Palmer. 5861-5876 [doi]

On the token distance modeling ability of higher RoPE attention dimensionXiangyu Hong, Che Jiang, Biqing Qi, Fandong Meng, Mo Yu, Bowen Zhou 0002, Jie Zhou 0016. 5877-5888 [doi]

Enhancing Byzantine-Resistant Aggregations with Client EmbeddingZhiyuan Zhang 0001, Hao Zhou 0012, Fandong Meng, Jie Zhou 0016, Xu Sun 0001. 5889-5896 [doi]

Exploiting Careful Design of SVM Solution for Aspect-term Sentiment AnalysisHanfeng Liu, Minping Chen, Zhenya Zheng, Zeyi Wen. 5897-5906 [doi]

Learning to Generate Rules for Realistic Few-Shot Relation Classification: An Encoder-Decoder ApproachMayank Singh, Eduardo Blanco 0002. 5907-5921 [doi]

Plot Twist: Multimodal Models Don't Comprehend Simple Chart DetailsYasaman Razeghi, Ishita Dasgupta 0001, Fangyu Liu, Vinay Ramasesh, Sameer Singh 0001. 5922-5937 [doi]

HateCOT: An Explanation-Enhanced Dataset for Generalizable Offensive Speech Detection via Large Language ModelsHuy Nghiem, Hal Daumé III. 5938-5956 [doi]

Giving Control Back to Models: Enabling Offensive Language Detection Models to Autonomously Identify and Mitigate BiasesJiapeng Liu, Weijie Li, Xiaochao Fan, Wenjun Deng, Liang Yang 0003, Yong Li, Yufeng Diao. 5957-5966 [doi]

Toolken+: Improving LLM Tool Usage with Reranking and a Reject OptionKonstantin Yakovlev, Sergey I. Nikolenko, Andrey Bout. 5967-5974 [doi]

SecureSQL: Evaluating Data Leakage of Large Language Models as Natural Language Interfaces to DatabasesYanqi Song, Ruiheng Liu, Shu Chen, Qianhao Ren, Yu Zhang 0030, Yongqi Yu. 5975-5990 [doi]

Llama SLayer 8B: Shallow Layers Hold the Key to Knowledge InjectionTianxiang Chen, Zhentao Tan, Tao Gong, Yue Wu, Qi Chu 0001, Bin Liu 0016, Jieping Ye, Nenghai Yu. 5991-6002 [doi]

Entity or Relation Embeddings? An Analysis of Encoding Strategies for Relation ExtractionFrank Mtumbuka, Steven Schockaert. 6003-6022 [doi]

Self-Consistency Boosts Calibration for Math ReasoningAnte Wang, Linfeng Song, Ye Tian, Baolin Peng, Lifeng Jin, Haitao Mi, Jinsong Su, Dong Yu. 6023-6029 [doi]

Distilling Instruction-following Abilities of Large Language Models with Task-aware Curriculum PlanningYuanhao Yue, Chengyu Wang, Jun Huang, Peng Wang. 6030-6054 [doi]

On Creating an English-Thai Code-switched Machine Translation in Medical DomainParinthapat Pengpun, Krittamate Tiankanon, Amrest Chinkamol, Jiramet Kinchagawat, Pitchaya Chairuengjitjaras, Pasit Supholkhan, Pubordee Aussavavirojekul, Chiraphat Boonnag, Kanyakorn Veerakanjana, Hirunkul Phimsiri, Boonthicha Sae-jia, Nattawach Sataudom, Piyalitt Ittichaiwong, Peerat Limkonchotiwat. 6055-6073 [doi]

CogGPT: Unleashing the Power of Cognitive Dynamics on Large Language ModelsYaojia Lv, Haojie Pan, Zekun Wang, Jiafeng Liang, Yuanxing Liu 0001, Ruiji Fu, Ming Liu 0004, Zhongyuan Wang 0006, Bing Qin 0001. 6074-6091 [doi]

Can LLMs Recognize Toxicity? A Structured Investigation Framework and Toxicity MetricHyukhun Koh, Dohyung Kim, Minwoo Lee 0003, Kyomin Jung. 6092-6114 [doi]

Toeing the Party Line: Election Manifestos as a Key to Understand Political Discourse on TwitterMaximilian Maurer, Tanise Ceron, Sebastian Padó, Gabriella Lapesa. 6115-6130 [doi]

UniTabNet: Bridging Vision and Language Models for Enhanced Table Structure RecognitionZhenrong Zhang, Shuhang Liu, Pengfei Hu 0006, Jiefeng Ma, Jun Du, Jianshu Zhang, Yu Hu 0003. 6131-6143 [doi]

PolyWER: A Holistic Evaluation Framework for Code-Switched Speech RecognitionKarima Kadaoui, Maryam Al Ali, Hawau Olamide Toyin, Ibrahim Mohammed, Hanan Aldarmaki. 6144-6153 [doi]

A Deep Analysis of the Impact of Multiword Expressions and Named Entities on Chinese-English Machine TranslationsHuacheng Song, Hongzhi Xu. 6154-6165 [doi]

SCA: Selective Compression Attention for Efficiently Extending the Context Window of Large Language ModelsHuanran Zheng, Wei Zhu, Xiaoling Wang. 6166-6178 [doi]

FANTAstic SEquences and Where to Find Them: Faithful and Efficient API Call Generation through State-tracked Constrained Decoding and RerankingZhuoer Wang, Leonardo F. R. Ribeiro, Alexandros Papangelis, Rohan Mukherjee, Tzu-Yen Wang, Xinyan Zhao, Arijit Biswas, James Caverlee, Angeliki Metallinou. 6179-6191 [doi]

Beyond Lines and Circles: Unveiling the Geometric Reasoning Gap in Large Language ModelsSpyridon Mouselinos, Henryk Michalewski, Mateusz Tomasz Malinowski. 6192-6222 [doi]

AdaMoE: Token-Adaptive Routing with Null Experts for Mixture-of-Experts Language ModelsZihao Zeng, Yibo Miao, Hongcheng Gao, Hao Zhang 0108, Zhijie Deng. 6223-6235 [doi]

Learning from Relevant Subgoals in Successful Dialogs using Iterative Training for Task-oriented Dialog SystemsMagdalena Kaiser, Patrick Ernst, György Szarvas. 6236-6246 [doi]

CLEAR: Can Language Models Really Understand Causal Graphs?Sirui Chen, Mengying Xu, Kun Wang, Xingyu Zeng, Rui Zhao, Shengjie Zhao, Chaochao Lu. 6247-6265 [doi]

PromptKD: Distilling Student-Friendly Knowledge for Generative Language Models via Prompt TuningGyeongman Kim, Doohyuk Jang, Eunho Yang. 6266-6282 [doi]

M2QA: Multi-domain Multilingual Question AnsweringLeon Engländer, Hannah Sterz, Clifton Poth, Jonas Pfeiffer, Ilia Kuznetsov, Iryna Gurevych. 6283-6305 [doi]

Unveiling the Invisible: Captioning Videos with MetaphorsAbisek Rajakumar Kalarani, Pushpak Bhattacharyya, Sumit Shekhar. 6306-6320 [doi]

How Reliable Are Automatic Evaluation Methods for Instruction-Tuned LLMs?Ehsan Doostmohammadi, Oskar Holmström, Marco Kuhlmann. 6321-6336 [doi]

RippleCOT: Amplifying Ripple Effect of Knowledge Editing in Language Models via Chain-of-Thought In-Context LearningZihao Zhao, Yuchen Yang, Yijiang Li, Yinzhi Cao. 6337-6347 [doi]

Authorship Obfuscation in Multilingual Machine-Generated Text DetectionDominik Macko, Róbert Móro, Adaku Uchendu, Ivan Srba, Jason Samuel Lucas, Michiharu Yamashita, Nafis Irtiza Tripto, Dongwon Lee 0001, Jakub Simko, Mária Bieliková. 6348-6368 [doi]

Comparing Edge-based and Node-based Methods on a Citation Prediction TaskPeter Vickers, Kenneth Church 0001. 6369-6388 [doi]

DAdEE: Unsupervised Domain Adaptation in Early Exit PLMsDivya Jyoti Bajpai, Manjesh K. Hanawal. 6389-6400 [doi]

LaCo: Large Language Model Pruning via Layer CollapseYifei Yang, Zouying Cao, Hai Zhao 0001. 6401-6417 [doi]

Llamipa: An Incremental Discourse ParserKate Thompson, Akshay Chaturvedi, Julie Hunter, Nicholas Asher. 6418-6430 [doi]

Nebula: A discourse aware Minecraft BuilderAkshay Chaturvedi, Kate Thompson, Nicholas Asher. 6431-6443 [doi]

Improving Referring Ability for Biomedical Language ModelsJunfeng Jiang, Fei Cheng 0002, Akiko Aizawa. 6444-6457 [doi]

CapEEN: Image Captioning with Early Exits and Knowledge DistillationDivya Jyoti Bajpai, Manjesh Kumar Hanawal. 6458-6472 [doi]

LumberChunker: Long-Form Narrative Document SegmentationAndré V. Duarte, João Marques, Miguel Graça, Miguel Freire, Lei Li 0005, Arlindo L. Oliveira. 6473-6486 [doi]

Exploring the Limits of Fine-grained LLM-based Physics Inference via Premise Removal InterventionsJordan Meadows, Tamsin James, André Freitas. 6487-6502 [doi]

Unlocking Continual Learning Abilities in Language ModelsWenyu Du, Shuang Cheng, Tongxu Luo, Zihan Qiu, Zeyu Huang, Ka-Chun Cheung, Reynold Cheng, Jie Fu 0001. 6503-6522 [doi]

On the Rigour of Scientific Writing: Criteria, Analysis, and InsightsJoseph James, Chenghao Xiao, Yucheng Li, Chenghua Lin. 6523-6538 [doi]

MMUTF: Multimodal Multimedia Event Argument Extraction with Unified Template FillingPhilipp Seeberger, Dominik Wagner 0002, Korbinian Riedhammer. 6539-6548 [doi]

Not All Preference Pairs Are Created Equal: A Recipe for Annotation-Efficient Iterative Preference LearningSen Yang 0005, Leyang Cui, Deng Cai 0002, Xinting Huang, Shuming Shi 0001, Wai Lam. 6549-6561 [doi]

Cross-lingual Contextualized Phrase RetrievalHuayang Li, Deng Cai 0002, Zhi Qu, Qu Cui, Hidetaka Kamigaito, Lemao Liu, Taro Watanabe. 6562-6576 [doi]

VideoINSTA: Zero-shot Long Video Understanding via Informative Spatial-Temporal Reasoning with LLMsRuotong Liao, Max Erler, Huiyu Wang, Guangyao Zhai, Gengyuan Zhang, Yunpu Ma, Volker Tresp. 6577-6602 [doi]

Self-Constructed Context Decompilation with Fined-grained Alignment EnhancementYunlong Feng, Dechuan Teng, Yang Xu 0049, Honglin Mu, Xiao Xu 0005, Libo Qin 0001, Qingfu Zhu, Wanxiang Che. 6603-6614 [doi]

Efficiently Computing Susceptibility to Context in Language ModelsTianyu Liu 0004, Kevin Du, Mrinmaya Sachan, Ryan Cotterell. 6615-6626 [doi]

ESG-Kor: A Korean Dataset for ESG-related Information Extraction and Practical Use CasesJaeyoung Lee, Geonyeong Son, Misuk Kim. 6627-6643 [doi]

Wrong-of-Thought: An Integrated Reasoning Framework with Multi-Perspective Verification and Wrong InformationYongheng Zhang, Qiguang Chen, Jingxuan Zhou, Peng Wang, Jiasheng Si, Jin Wang, Wenpeng Lu, Libo Qin 0001. 6644-6653 [doi]

Hope 'The Paragraph Guy' explains the rest : Introducing MeSum, the Meme SummarizerAnas Khan, Tanik Saikh, Arpan Phukan, Asif Ekbal. 6654-6668 [doi]

Learning Semantic Structure through First-Order-Logic TranslationAkshay Chaturvedi, Nicholas Asher. 6669-6680 [doi]

A Training Data Recipe to Accelerate A* Search with Language ModelsDevaansh Gupta, Boyang Li. 6681-6695 [doi]

From Generation to Selection: Findings of Converting Analogical Problem-Solving into Multiple-Choice QuestionsDonghyeon Shin, Seungpil Lee, Klea Kovacec, Sundong Kim. 6696-6708 [doi]

What's under the hood: Investigating Automatic Metrics on Meeting SummarizationFrederic Kirstein, Jan Philip Wahle, Terry Ruas, Bela Gipp. 6709-6723 [doi]

Self-Distillation for Model Stacking Unlocks Cross-Lingual NLU in 200+ LanguagesFabian David Schmidt, Philipp Borchert, Ivan Vulic, Goran Glavas. 6724-6743 [doi]

CERD: A Comprehensive Chinese Rhetoric Dataset for Rhetorical Understanding and Generation in EssaysNuowei Liu, Xinhao Chen, Hongyi Wu, Changzhi Sun, Man Lan, Yuanbin Wu, Xiaopeng Bai, Shaoguang Mao, Yan Xia 0005. 6744-6759 [doi]

An Empirical Study on Cross-lingual Vocabulary Adaptation for Efficient Language Model InferenceAtsuki Yamaguchi, Aline Villavicencio, Nikolaos Aletras. 6760-6785 [doi]

AutoDetect: Towards a Unified Framework for Automated Weakness Detection in Large Language ModelsJiale Cheng, Yida Lu, Xiaotao Gu, Pei Ke, Xiao Liu 0036, Yuxiao Dong, Hongning Wang, Jie Tang 0001, Minlie Huang. 6786-6803 [doi]

BAPO: Base-Anchored Preference Optimization for Overcoming Forgetting in Large Language Models PersonalizationGihun Lee, Minchan Jeong, Yujin Kim, Hojung Jung, Jaehoon Oh, Sangmook Kim, Se-Young Yun. 6804-6820 [doi]

Beyond Common Words: Enhancing ASR Cross-Lingual Proper Noun Recognition Using Large Language ModelsRishabh Kumar, Sabyasachi Ghosh, Ganesh Ramakrishnan. 6821-6828 [doi]

Few-shot clinical entity recognition in English, French and Spanish: masked language models outperform generative model promptingMarco Naguib, Xavier Tannier, Aurélie Névéol. 6829-6852 [doi]

STTATTS: Unified Speech-To-Text And Text-To-Speech ModelHawau Olamide Toyin, Hao Li, Hanan Aldarmaki. 6853-6863 [doi]

From Text Segmentation to Enhanced Representation Learning: A Novel Approach to Multi-Label Classification for Long TextsWang Zhang, Xin Wang, Qian Wang, Tao Deng, Xiaoru Wu. 6864-6873 [doi]

Learning from Imperfect Data: Towards Efficient Knowledge Distillation of Autoregressive Language Models for Text-to-SQLQihuang Zhong, Kunfeng Chen, Liang Ding 0006, Juhua Liu, Bo Du 0001, Dacheng Tao. 6874-6885 [doi]

ConU: Conformal Uncertainty in Large Language Models with Correctness Coverage GuaranteesZhiyuan Wang, Jinhao Duan, Lu Cheng, Yue Zhang, Qingni Wang, Xiaoshuang Shi, Kaidi Xu, Heng Tao Shen, Xiaofeng Zhu 0001. 6886-6898 [doi]

Irrelevant Alternatives Bias Large Language Model Hiring DecisionsKremena Valkanova, Pencho Yordanov. 6899-6912 [doi]

PclGPT: A Large Language Model for Patronizing and Condescending Language DetectionHongbo Wang, LiMingDa LiMingDa, Junyu Lu, Hebin Xia, Liang Yang 0003, Bo Xu 0009, Ruizhu Liu, Hongfei Lin. 6913-6928 [doi]

MultiAgent Collaboration Attack: Investigating Adversarial Attacks in Large Language Model Collaborations via DebateAlfonso Amayuelas, Xianjun Yang, Antonis Antoniades, Wenyue Hua, Liangming Pan, William Yang Wang. 6929-6948 [doi]

CEAMC: Corpus and Empirical Study of Argument Analysis in Education via LLMsYupei Ren, Hongyi Wu, Zhaoguang Long, Shangqing Zhao, Xinyi Zhou, Zheqin Yin, Xinlin Zhuang, Xiaopeng Bai, Man Lan. 6949-6966 [doi]

Ada-Instruct: Adapting Instruction Generators for Complex ReasoningWanyun Cui, Qianle Wang. 6967-6984 [doi]

LINKAGE: Listwise Ranking among Varied-Quality References for Non-Factoid QA Evaluation via LLMsSihui Yang, Keping Bi, Wanqing Cui, Jiafeng Guo, Xueqi Cheng. 6985-7000 [doi]

Breaking Language Barriers in Multilingual Mathematical Reasoning: Insights and ObservationsNuo Chen 0001, Zinan Zheng, Ning Wu, Ming Gong, Dongmei Zhang 0001, Jia Li 0009. 7001-7016 [doi]

SynthEval: Hybrid Behavioral Testing of NLP Models with Synthetic EvaluationRaoyuan Zhao, Abdullatif Köksal, Yihong Liu, Leonie Weissweiler, Anna Korhonen, Hinrich Schütze. 7017-7034 [doi]

TurkishMMLU: Measuring Massive Multitask Language Understanding in TurkishArda Yüksel, Abdullatif Köksal, Lütfi Kerem Senel, Anna Korhonen, Hinrich Schütze. 7035-7055 [doi]

LongForm: Effective Instruction Tuning with Reverse InstructionsAbdullatif Köksal, Timo Schick, Anna Korhonen, Hinrich Schütze. 7056-7078 [doi]

Explaining Graph Neural Networks with Large Language Models: A Counterfactual Perspective on Molecule GraphsYinhan He, Zaiyi Zheng, Patrick Soga, Yaochen Zhu, Yushun Dong, Jundong Li. 7079-7096 [doi]

Knowledge Mechanisms in Large Language Models: A Survey and PerspectiveMengru Wang, Yunzhi Yao, Ziwen Xu, Shuofei Qiao, Shumin Deng, Peng Wang 0104, Xiang Chen 0016, Jia-Chen Gu, Yong Jiang 0001, Pengjun Xie, Fei Huang 0004, Huajun Chen, Ningyu Zhang 0001. 7097-7135 [doi]

LongHeads: Multi-Head Attention is Secretly a Long Context ProcessorYi Lu, Xin Zhou 0012, Wei He 0024, Jun Zhao 0019, Tao Ji, Tao Gui, Qi Zhang 0001, Xuanjing Huang 0001. 7136-7148 [doi]

Crisis counselor language and perceived genuine concern in crisis conversationsGreg Buda, Ignacio Tripodi, Margaret Meagher, Elizabeth A. Olson. 7149-7160 [doi]

Edit-Constrained Decoding for Sentence SimplificationTatsuya Zetsu, Yuki Arase, Tomoyuki Kajiwara. 7161-7173 [doi]

Modeling Human Subjectivity in LLMs Using Explicit and Implicit Human Factors in PersonasSalvatore Giorgi, Tingting Liu, Ankit Aich, Kelsey Isman, Garrick Sherman, Zachary Fried, João Sedoc, Lyle H. Ungar, Brenda Curtis. 7174-7188 [doi]

Multi-Loss Fusion: Angular and Contrastive Integration for Machine-Generated Text DetectionIqra Zahid, Yue Chang, Tharindu Madusanka, Youcheng Sun, Riza Batista-Navarro. 7189-7202 [doi]

Intermediate Layer Distillation with the Reused Teacher Classifier: A Study on the Importance of the Classifier of Attention-based ModelsHang Zhang, Seyyed Hasan Mozafari, James J. Clark, Brett H. Meyer, Warren J. Gross. 7203-7212 [doi]

Enhancing Large Language Model Based Sequential Recommender Systems with Pseudo Labels ReconstructionHyunsoo Na, Minseok Gang, Youngrok Ko, Jinseok Seol, Sang-goo Lee. 7213-7222 [doi]

On the Generalization of Training-based ChatGPT Detection MethodsHan Xu 0002, Jie Ren 0019, Pengfei He, Shenglai Zeng, Yingqian Cui, Amy Liu, Hui Liu, Jiliang Tang. 7223-7243 [doi]

Private prediction for large-scale synthetic text generationKareem Amin 0002, Alex Bie, Weiwei Kong, Alexey Kurakin, Natalia Ponomareva 0001, Umar Syed, Andreas Terzis, Sergei Vassilvitskii. 7244-7262 [doi]

Generalists vs. Specialists: Evaluating Large Language Models for UrduSamee Arif, Abdul Hameed Azeemi, Agha Ali Raza, Awais Athar. 7263-7280 [doi]

Improving Multi-Agent Debate with Sparse Communication TopologyYunxuan Li, Yibing Du, Jiageng Zhang, Le Hou, Peter Grabowski, Yeqing Li, Eugene Ie. 7281-7294 [doi]

Evidence Retrieval for Fact Verification using Multi-stage RerankingShrikant Malviya, Stamos Katsigiannis. 7295-7308 [doi]

Multi-step Problem Solving Through a Verifier: An Empirical Analysis on Model-induced Process SupervisionZihan Wang 0001, Yunxuan Li, Yuexin Wu, Liangchen Luo, Le Hou, Hongkun Yu 0001, Jingbo Shang. 7309-7319 [doi]

MUSCLE: A Model Update Strategy for Compatible LLM EvolutionJessica Maria Echterhoff, Fartash Faghri, Raviteja Vemulapalli, Ting-Yao Hu, Chun-Liang Li, Oncel Tuzel, Hadi Pouransari. 7320-7332 [doi]

Event-Keyed SummarizationWilliam Gantt, Alexander Martin 0006, Pavlo Kuchmiichuk, Aaron Steven White. 7333-7345 [doi]

The Effect of Sampling Temperature on Problem Solving in Large Language ModelsMatthew Renze. 7346-7356 [doi]

HiCuLR: Hierarchical Curriculum Learning for Rhetorical Role Labeling of Legal DocumentsT. Y. S. S. Santosh, Apolline Isaia, Shiyu Hong, Matthias Grabmair. 7357-7364 [doi]

Semi-Supervised Reward Modeling via Iterative Self-TrainingYifei He, Haoxiang Wang 0003, Ziyan Jiang, Alexandros Papangelis, Han Zhao 0002. 7365-7377 [doi]

Demonstration Selection Strategies for Numerical Time Series Data-to-TextMasayuki Kawarada, Tatsuya Ishigaki, Goran Topic, Hiroya Takamura. 7378-7392 [doi]

ALIGN-SIM: A Task-Free Test Bed for Evaluating and Interpreting Sentence Embeddings through Semantic Similarity AlignmentYash Mahajan, Naman Bansal, Eduardo Blanco 0002, Santu Karmaker. 7393-7428 [doi]

BIPEFT: Budget-Guided Iterative Search for Parameter Efficient Fine-Tuning of Large Pretrained Language ModelsAofei Chang, Jiaqi Wang 0002, Han Liu 0008, Parminder Bhatia, Cao Xiao, Ting Wang 0006, Fenglong Ma. 7429-7440 [doi]

In-Context Learning with Iterative Demonstration SelectionChengwei Qin, Aston Zhang, Chen Chen 0075, Anirudh Dagar, Wenming Ye. 7441-7455 [doi]

On Evaluating Explanation Utility for Human-AI Decision Making in NLPFateme Hashemi Chaleshtori, Atreya Ghosal, Alexander Gill, Purbid Bambroo, Ana Marasovic. 7456-7504 [doi]

Unsupervised Hierarchical Topic Modeling via Anchor Word Clustering and Path GuidanceJiyuan Liu, Hegang Chen, Chunjiang Zhu, Yanghui Rao. 7505-7517 [doi]

GuardEmb: Dynamic Watermark for Safeguarding Large Language Model Embedding Service Against Model Stealing AttackLiaoyaqi Wang, Minhao Cheng. 7518-7534 [doi]

Difficult Task Yes but Simple Task No: Unveiling the Laziness in Multimodal LLMsSihang Zhao, Youliang Yuan, Xiaoying Tang 0002, Pinjia He. 7535-7548 [doi]

Pseudo-Label Enhanced Prototypical Contrastive Learning for Uniformed Intent DiscoveryYimin Deng, Yuxia Wu, Guoshuai Zhao, Li Zhu, Xueming Qian. 7549-7562 [doi]

RoLoRA: Fine-tuning Rotated Outlier-free LLMs for Effective Weight-Activation QuantizationXijie Huang, Zechun Liu, Shih-Yang Liu, Kwang-Ting Cheng. 7563-7576 [doi]

Can Large Language Models Grasp Legal Theories? Enhance Legal Reasoning with Insights from Multi-Agent CollaborationWeikang Yuan, Junjie Cao, Zhuoren Jiang, Yangyang Kang, Jun Lin, Kaisong Song, Tianqianjin Lin, Pengwei Yan, Changlong Sun, Xiaozhong Liu. 7577-7597 [doi]

Retrieval and Reasoning on KGs: Integrate Knowledge Graphs into Large Language Models for Complex Question AnsweringYixin Ji, Kaixin Wu, Juntao Li, Wei Chen 0034, Mingjie Zhong, Xu Jia, Min Zhang 0005. 7598-7610 [doi]

Insights into LLM Long-Context Failures: When Transformers Know but Don't TellMuhan Gao, Taiming Lu, Kuai Yu, Adam Byerly, Daniel Khashabi. 7611-7625 [doi]

E²CL: Exploration-based Error Correction Learning for Embodied AgentsHanlin Wang, Chak Tou Leong, Jian Wang 0054, Wenjie Li 0002. 7626-7639 [doi]

BERGEN: A Benchmarking Library for Retrieval-Augmented GenerationDavid Rau, Hervé Déjean, Nadezhda Chirkova, Thibault Formal, Shuai Wang 0004, Stéphane Clinchant, Vassilina Nikoulina. 7640-7663 [doi]

Contextualized Graph Representations for Generating Counter-Narratives against Hate SpeechSelene Baez Santamaría, Helena Gómez-Adorno, Ilia Markov. 7664-7674 [doi]

Modeling Historical Relevant and Local Frequency Context for Representation-Based Temporal Knowledge Graph ForecastingShengzhe Zhang, Wei Wei 0002, Rikui Huang, Wenfeng Xie, Dangyang Chen. 7675-7686 [doi]

Representation Alignment and Adversarial Networks for Cross-lingual Dependency ParsingYing Li, Jianjian Liu, Zhengtao Yu 0001, Shengxiang Gao, Yuxin Huang, Cunli Mao. 7687-7697 [doi]

An Instruction Tuning-Based Contrastive Learning Framework for Aspect Sentiment Quad Prediction with Implicit Aspects and OpinionsHao Zhang, Yu-N Cheah, Congqing He, Feifan Yi. 7698-7714 [doi]

MACAROON: Training Vision-Language Models To Be Your Engaged PartnersShujin Wu, Yi Fung 0001, Sha Li, Yixin Wan, Kai-Wei Chang, Heng Ji. 7715-7731 [doi]

ICL: Iterative Continual Learning for Multi-domain Neural Machine TranslationZhibo Man, Kaiyu Huang, Yujie Zhang, Yuanmeng Chen, Yufeng Chen 0005, Jinan Xu. 7732-7743 [doi]

Mitigating Hallucinations of Large Language Models in Medical Information Extraction via Contrastive DecodingDerong Xu, Ziheng Zhang, Zhihong Zhu, Zhenxi Lin, Qidong Liu, Xian Wu 0001, Tong Xu 0001, Xiangyu Zhao 0001, Yefeng Zheng 0001, Enhong Chen. 7744-7757 [doi]

NeuroMax: Enhancing Neural Topic Modeling via Maximizing Mutual Information and Group Topic RegularizationDuy-Tung Pham, Thien Trang Nguyen Vu, Tung Nguyen, Linh Ngo, Duc Anh Nguyen, Thien Huu Nguyen. 7758-7772 [doi]

LLM Self-Correction with DeCRIM: Decompose, Critique, and Refine for Enhanced Following of Instructions with Multiple ConstraintsThomas Palmeira Ferraz, Kartik Mehta, Yu-Hsiang Lin, Haw-Shiuan Chang, Shereen Oraby, Sijia Liu 0001, Vivek Subramanian, Tagyoung Chung, Mohit Bansal, Nanyun Peng. 7773-7812 [doi]

Learning to Plan for Retrieval-Augmented Large Language Models from Knowledge GraphsJunjie Wang, Mingyang Chen, Binbin Hu, Dan Yang, Ziqi Liu, Yue Shen, Peng Wei, Zhiqiang Zhang 0012, Jinjie Gu, Jun Zhou 0011, Jeff Z. Pan, Wen Zhang 0015, Huajun Chen. 7813-7835 [doi]

Is Compound Aspect-Based Sentiment Analysis Addressed by LLMs?Yinhao Bai, Zhixin Han, Yuhua Zhao, Hang Gao 0003, Zhuowei Zhang, Xunzhi Wang, Mengting Hu. 7836-7861 [doi]

Multilingual Fine-Grained News Headline Hallucination DetectionJiaming Shen, Tianqi Liu 0002, Jialu Liu, Zhen Qin 0001, Jay Pavagadhi, Simon Baumgartner, Michael Bendersky. 7862-7875 [doi]

PE: A Poincare Explanation Method for Fast Text Hierarchy GenerationQian Chen, Dongyang Li, Xiaofeng He, Hongzhao Li, Hongyu Yi. 7876-7888 [doi]

Step-level Value Preference Optimization for Mathematical ReasoningGuoxin Chen, Minpeng Liao, Chengxi Li 0014, Kai Fan 0002. 7889-7903 [doi]

Towards Benchmarking Situational Awareness of Large Language Models: Comprehensive Benchmark, Evaluation and AnalysisGuo Tang, Zheng Chu, Wenxiang Zheng, Ming Liu 0004, Bing Qin 0001. 7904-7928 [doi]

Balancing Visual Context Understanding in Dialogue for Image RetrievalZhaohui Wei, Lizi Liao, Xiaoyu Du, Xinguang Xiang. 7929-7942 [doi]

Mechanistic Understanding and Mitigation of Language Model Non-Factual HallucinationsLei Yu, Meng Cao, Jackie C. K. Cheung, Yue Dong 0002. 7943-7956 [doi]

A Study of Implicit Ranking Unfairness in Large Language ModelsChen Xu 0010, Wenjie Wang 0007, Yuxin Li, Liang Pang, Jun Xu 0001, Tat-Seng Chua. 7957-7970 [doi]

Information Parity: Measuring and Predicting the Multilingual Capabilities of Language ModelsAlexander Tsvetkov, Alon Kipnis. 7971-7989 [doi]

Better Call SAUL: Fluent and Consistent Language Model Editing with Generation RegularizationMingyang Wang, Lukas Lange, Heike Adel, Jannik Strötgen, Hinrich Schütze. 7990-8000 [doi]

A Semantic Search Engine for Mathlib4Guoxiong Gao, Haocheng Ju, Jiedong Jiang, Zihan Qin, Bin Dong 0001. 8001-8013 [doi]

DyKnow: Dynamically Verifying Time-Sensitive Factual Knowledge in LLMsSeyed Mahed Mousavi, Simone Alghisi, Giuseppe Riccardi. 8014-8029 [doi]

Rewarding What Matters: Step-by-Step Reinforcement Learning for Task-Oriented DialogueHuifang Du, Shuqin Li, Minghao Wu, Xuejing Feng, Yuan-Fang Li, Haofen Wang. 8030-8046 [doi]

Assistive Large Language Model Agents for Socially-Aware Negotiation DialoguesYuncheng Hua, Lizhen Qu, Reza Haf. 8047-8074 [doi]

HoLLMwood: Unleashing the Creativity of Large Language Models in Screenwriting via Role PlayingJing Chen, Xinyu Zhu, Cheng Yang, Chufan Shi, Yadong Xi, Yuxiang Zhang, Junjie Wang, Jiashu Pu, Tian Feng, Yujiu Yang, Rongsheng Zhang. 8075-8121 [doi]

Advancing Cross-Lingual Entity Alignment with Large Language Models: Tailored Sample Segmentation and Zero-Shot PromptsLinyan Yang, Jingwei Cheng, Fu Zhang 0001. 8122-8138 [doi]

Causal Discovery Inspired Unsupervised Domain Adaptation for Emotion-Cause Pair ExtractionYuncheng Hua, Yujin Huang, Shuo Huang, Tao Feng 0013, Lizhen Qu, Christopher Bain, Richard Bassed, Reza Haf. 8139-8156 [doi]

Large Language Models are Students at Various Levels: Zero-shot Question Difficulty EstimationJae-Woo Park, Seong-Jin Park, Hyun-Sik Won, Kang Min Kim. 8157-8177 [doi]

Inverse-Q*: Token Level Reinforcement Learning for Aligning Large Language Models Without Preference DataHan-xia, Songyang Gao, Qiming Ge, Zhiheng Xi, Qi Zhang 0001, Xuanjing Huang 0001. 8178-8188 [doi]

Activation Scaling for Steering and Interpreting Language ModelsNiklas Stoehr, Kevin Du, Vésteinn Snæbjarnarson, Robert West, Ryan Cotterell, Aaron Schein. 8189-8200 [doi]

LaRA: Large Rank Adaptation for Speech and Text Cross-Modal Learning in Large Language ModelsZuhair Hasan Shaik, Pradyoth Hegde, Prashant Bannulmath, Deepak K. T.. 8201-8211 [doi]

DTS-SQL: Decomposed Text-to-SQL with Small Large Language ModelsMohammadreza Pourreza, Davood Rafiei. 8212-8220 [doi]

MedINST: Meta Dataset of Biomedical InstructionsWenhan Han, Meng Fang, Zihan Zhang, Yu Yin, Zirui Song, Ling Chen 0006, Mykola Pechenizkiy, Qingyu Chen 0001. 8221-8240 [doi]

PropTest: Automatic Property Testing for Improved Visual ProgrammingJaywon Koo, Ziyan Yang, Paola Cascante-Bonilla, Baishakhi Ray, Vicente Ordonez. 8241-8256 [doi]

BadFair: Backdoored Fairness Attacks with Group-conditioned TriggersJiaqi Xue, Qian Lou, Mengxin Zheng. 8257-8270 [doi]

Is GPT-4V (ision) All You Need for Automating Academic Data Visualization? Exploring Vision-Language Models' Capability in Reproducing Academic ChartsZhehao Zhang, Weicheng Ma, Soroush Vosoughi. 8271-8288 [doi]

Financial Forecasting from Textual and Tabular Time SeriesRoss Koval, Nicholas Andrews, Xifeng Yan. 8289-8300 [doi]

Learning to Ask Denotative and Connotative Questions for Knowledge-based VQAXiaoying Xing, Peixi Xiong, Lei Fan, Yunxuan Li, Ying Wu 0001. 8301-8315 [doi]

CONTOR: Benchmarking Strategies for Completing Ontologies with Plausible Missing RulesNa Li, Thomas Bailleux, Zied Bouraoui, Steven Schockaert. 8316-8334 [doi]

Towards Pareto-Efficient RLHF: Paying Attention to a Few High-Reward Samples with Reward DropoutChanghun Lee, Chiehyeon Lim. 8335-8349 [doi]

Weak-to-Strong ReasoningYuqing Yang 0004, Yan Ma, Pengfei Liu 0003. 8350-8367 [doi]

Fine-Tuning Language Models with Differential Privacy through Adaptive Noise AllocationXianzhi Li, Ran Zmigrod, Zhiqiang Ma, Xiaomo Liu, Xiaodan Zhu 0001. 8368-8375 [doi]

The Mystery of Compositional Generalization in Graph-based Generative Commonsense ReasoningXiyan Fu, Anette Frank. 8376-8394 [doi]

AutoHallusion: Automatic Generation of Hallucination Benchmarks for Vision-Language ModelsXiyang Wu, Tianrui Guan, Dianqi Li, Shuaiyi Huang, Xiaoyu Liu 0003, Xijun Wang 0002, Ruiqi Xian, Abhinav Shrivastava, Furong Huang, Jordan L. Boyd-Graber, Tianyi Zhou 0001, Dinesh Manocha. 8395-8419 [doi]

MetaKP: On-Demand Keyphrase GenerationDi Wu 0054, Xiaoxian Shen, Kai-Wei Chang. 8420-8437 [doi]

PSST: A Benchmark for Evaluation-driven Text Public-Speaking Style TransferHuashan Sun, Yixiao Wu, Yizhe Yang, Yinghao Li, Jiawei Li, Yuhao Ye, Yang Gao. 8438-8471 [doi]

TRACE the Evidence: Constructing Knowledge-Grounded Reasoning Chains for Retrieval-Augmented GenerationJinyuan Fang, Zaiqiao Meng, Craig Macdonald. 8472-8494 [doi]

Enable Fast Sampling for Seq2Seq Text DiffusionPan Liu, Xiaohua Tian, Zhouhan Lin. 8495-8505 [doi]

AlignSum: Data Pyramid Hierarchical Fine-tuning for Aligning with Human Summarization PreferenceYang Han, Yiming Wang, Rui Wang 0015, Lu Chen 0002, Kai Yu 0004. 8506-8522 [doi]

CHIRON: Rich Character Representations in Long-Form NarrativesAlexander Gurung, Mirella Lapata. 8523-8547 [doi]

Refiner: Restructure Retrieved Content Efficiently to Advance Question-Answering CapabilitiesZhonghao Li, Xuming Hu, Aiwei Liu, Kening Zheng, Sirui Huang, Hui Xiong 0001. 8548-8572 [doi]

Infrared-LLaVA: Enhancing Understanding of Infrared Images in Multi-Modal Large Language ModelsShixin Jiang, Zerui Chen, Jiafeng Liang, Yanyan Zhao, Ming Liu 0004, Bing Qin 0001. 8573-8591 [doi]

LPZero: Language Model Zero-cost Proxy Search from ZeroPeijie Dong, Lujun Li, Xiang Liu, Zhenheng Tang, Xuebo Liu, Qiang Wang 0022, Xiaowen Chu 0001. 8592-8614 [doi]

Traffic Light or Light Traffic? Investigating Phrasal Semantics in Large Language ModelsRui Meng, Ye Liu 0006, Lifu Tu, Daqing He, Yingbo Zhou, Semih Yavuz. 8615-8622 [doi]

How Far Can In-Context Alignment Go? Exploring the State of In-Context AlignmentHeyan Huang, Yinghao Li, Huashan Sun, Yu Bai 0018, Yang Gao 0016. 8623-8644 [doi]

Variational Language Concepts for Interpreting Foundation Language ModelsHengyi Wang, Shiwei Tan, Zhiqing Hong, Desheng Zhang, Hao Wang 0014. 8645-8671 [doi]

Exploring the Capability of Multimodal LLMs with Yonkoma Manga: The YManga Dataset and Its Challenging TasksQi Yang, Jingjie Zeng, Liang Yang 0003, Zhihao Yang, Hongfei Lin. 8672-8687 [doi]

TWBias: A Benchmark for Assessing Social Bias in Traditional Chinese Large Language Models through a Taiwan Cultural LensHsin-Yi Hsieh, Shih-Cheng Huang, Richard Tzong-Han Tsai. 8688-8704 [doi]

Unlocking the Potential of Model Merging for Low-Resource LanguagesMingxu Tao, Chen Zhang 0020, Quzhe Huang, Tianyao Ma, Songfang Huang, Dongyan Zhao 0001, Yansong Feng 0002. 8705-8720 [doi]

PURE: Aligning LLM via Pluggable Query Reformulation for Enhanced HelpfulnessWenjin Yao, Yidong Wang, Zhuohao Yu, Rui Xie 0003, Shikun Zhang, Wei Ye 0004. 8721-8744 [doi]

MMedAgent: Learning to Use Medical Tools with Multi-modal AgentBinxu Li, Tiankai Yan, Yuanting Pan, Jie Luo, Ruiyang Ji, Jiayuan Ding, Zhe Xu, Shilong Liu, Haoyu Dong, Zihao Lin, Yixin Wang. 8745-8760 [doi]

SALMON: A Structure-Aware Language Model with logicality and densification strategy for Temporal Knowledge Graph ReasoningFu Zhang, Jinghao Lin, Jingwei Cheng. 8761-8774 [doi]

Multilingual Contrastive Decoding via Language-Agnostic Layers SkippingWenhao Zhu, Sizhe Liu, Shujian Huang, Shuaijie She, Chris Wendler, Jiajun Chen. 8775-8782 [doi]

The Potential and Challenges of Evaluating Attitudes, Opinions, and Values in Large Language ModelsBolei Ma, Xinpeng Wang 0003, Tiancheng Hu, Anna-Carolina Haensch, Michael A. Hedderich, Barbara Plank, Frauke Kreuter. 8783-8805 [doi]

Low-Resource Machine Translation through the Lens of Personalized Federated LearningViktor Moskvoretskii, Nazarii Tupitsa, Chris Biemann, Samuel Horváth, Eduard Gorbunov, Irina Nikishina. 8806-8825 [doi]

Can Language Models Recognize Convincing Arguments?Paula Rescala, Manoel Horta Ribeiro, Tiancheng Hu, Robert West 0001. 8826-8837 [doi]

Knowledge Navigator: LLM-guided Browsing Framework for Exploratory Search in Scientific LiteratureUri Katz, Mosh Levy, Yoav Goldberg. 8838-8855 [doi]

Scalable and Domain-General Abstractive Proposition SegmentationMohammad Javad Hosseini, Yang Gao, Tim Baumgärtner, Alex Fabrikant, Reinald Kim Amplayo. 8856-8872 [doi]

Hit the Nail on the Head: Parameter-Efficient Multi-task Tuning via Human Language InterventionWenxuan Lu, SongHao Jiang, Yijing Wang, Tianning Zang. 8873-8885 [doi]

LINKED: Eliciting, Filtering and Integrating Knowledge in Large Language Model for Commonsense ReasoningJiachun Li, Pengfei Cao, Chenhao Wang, Zhuoran Jin, Yubo Chen 0001, Kang Liu 0001, Xiaojian Jiang, Jiexin Xu, Jun Zhao 0001. 8886-8905 [doi]

Beyond Agreement: Diagnosing the Rationale Alignment of Automated Essay Scoring Methods based on Linguistically-informed CounterfactualsYupei Wang, Renfen Hu, Zhe Zhao 0006. 8906-8925 [doi]

TS-Align: A Teacher-Student Collaborative Framework for Scalable Iterative Finetuning of Large Language ModelsChen Zhang 0020, Chengguang Tang, Dading Chong, Ke Shi, Guohua Tang, Feng Jiang, Haizhou Li 0001. 8926-8946 [doi]

Datasets for Multilingual Answer Sentence SelectionMatteo Gabburo, Stefano Campese, Federico Agostini, Alessandro Moschitti. 8947-8958 [doi]

Active Learning for Abstractive Text Summarization via LLM-Determined Curriculum and Certainty Gain MaximizationDongyuan Li, Ying Zhang 0065, Zhen Wang, Shiyin Tan, Satoshi Kosugi, Manabu Okumura. 8959-8971 [doi]

Question-guided Knowledge Graph Re-scoring and Injection for Knowledge Graph Question AnsweringYu Zhang 0092, Kehai Chen, Xuefeng Bai 0001, Zhao Kang 0001, Quanjiang Guo, Min Zhang 0005. 8972-8985 [doi]

Achieving Stronger Generation via Simple Contrastive TuningZhimeng Wang, Pinzheng Wang, Juntao Li, Yibin Chen, Min Zhang. 8986-8999 [doi]

Forecasting Future International Events: A Reliable Dataset for Text-Based Event ModelingDaehoon Gwak, Junwoo Park, Minho Park 0003, ChaeHun Park, Hyunchan Lee, Edward Choi, Jaegul Choo. 9000-9023 [doi]

QPaug: Question and Passage Augmentation for Open-Domain Question Answering of LLMsMinsang Kim, Cheoneum Park, Seung Baek. 9024-9042 [doi]

ICON: Improving Inter-Report Consistency in Radiology Report Generation via Lesion-aware Mixup AugmentationWenjun Hou, Yi Cheng, Kaishuai Xu, Yan Hu, Wenjie Li, Jiang Liu. 9043-9056 [doi]

DiaHalu: A Dialogue-level Hallucination Evaluation Benchmark for Large Language ModelsKedi Chen, Qin Chen, Jie Zhou 0015, Yishen He, Liang He 0001. 9057-9079 [doi]

ExpertEase: A Multi-Agent Framework for Grade-Specific Document Simplification with Large Language ModelsKaijie Mo, Renfen Hu. 9080-9099 [doi]

Class Name Guided Out-of-Scope Intent ClassificationChandan Gautam, Sethupathy Parameswaran, Aditya Kane, Yuan Fang 0001, Savitha Ramasamy, Suresh Sundaram 0002, Sunil Sahu, Xiaoli Li 0001. 9100-9112 [doi]

Inference-Time Decontamination: Reusing Leaked Benchmarks for Large Language Model EvaluationQin Zhu, Qinyuan Cheng, Runyu Peng, Xiaonan Li, Ru Peng, Tengxiao Liu, Xipeng Qiu, Xuanjing Huang 0001. 9113-9129 [doi]

MultiVerse: Efficient and Expressive Zero-Shot Multi-Task Text-to-SpeechTaejun Bak, Youngsik Eom, SeungJae Choi, Young-Sun Joo. 9130-9147 [doi]

RoBERT2VecTM: A Novel Approach for Topic Extraction in Islamic StudiesSania Aftar, Luca Gagliardelli, Amina El Ganadi, Federico Ruozzi, Sonia Bergamaschi. 9148-9158 [doi]

Are ELECTRA's Sentence Embeddings Beyond Repair? The Case of Semantic Textual SimilarityIvan Rep, David Dukic, Jan Snajder. 9159-9169 [doi]

DetectiveNN: Imitating Human Emotional Reasoning with a Recall-Detect-Predict Framework for Emotion Recognition in ConversationsSimin Hong, Jun Sun, Taihao Li. 9170-9180 [doi]

HyperBERT: Mixing Hypergraph-Aware Layers with Language Models for Node Classification on Text-Attributed HypergraphsAdrián Bazaga, Pietro Lio, Gos Micklem. 9181-9193 [doi]

On Diversified Preferences of Large Language Model AlignmentDun Zeng, Yong Dai, Pengyu Cheng, Longyue Wang, Tianhao Hu, Wanshun Chen, Nan Du, Zenglin Xu. 9194-9210 [doi]

LoRAExit: Empowering Dynamic Modulation of LLMs in Resource-limited Settings using Low-rank AdaptersJiacheng Liu 0001, Peng Tang, Xiaofeng Hou, Chao Li 0009, Pheng-Ann Heng. 9211-9225 [doi]

Improving Diversity of Commonsense Generation by Large Language Models via In-Context LearningTianhui Zhang, Bei Peng, Danushka Bollegala. 9226-9242 [doi]

CodeIP: A Grammar-Guided Multi-Bit Watermark for Large Language Models of CodeBatu Guan, Yao Wan 0001, Zhangqian Bi, Zheng Wang, Hongyu Zhang 0002, Pan Zhou 0001, Lichao Sun 0001. 9243-9258 [doi]

StablePT : Towards Stable Prompting for Few-shot Learning via Input SeparationXiaoming Liu, Chen Liu, Zhaohan Zhang, Chengzhengxu Li, Longtian Wang, Yu Lan, Chao Shen. 9259-9273 [doi]

Natural Evolution-based Dual-Level Aggregation for Temporal Knowledge Graph ReasoningBin Chen, Chunjing Xiao, Fan Zhou 0002. 9274-9284 [doi]

Creative and Context-Aware Translation of East Asian Idioms with GPT-4Kenan Tang, Peiyang Song, Yao Qin, Xifeng Yan. 9285-9305 [doi]

Towards Implicit Bias Detection and Mitigation in Multi-Agent LLM InteractionsAngana Borah, Rada Mihalcea. 9306-9326 [doi]

Exploring Hint Generation Approaches for Open-Domain Question AnsweringJamshid Mozafari, Abdelrahman Abdallah, Bhawna Piryani, Adam Jatowt. 9327-9352 [doi]

Do LLMs Think Fast and Slow? A Causal Study on Sentiment AnalysisZhiheng Lyu, Zhijing Jin 0001, Fernando Gonzalez Adauto, Rada Mihalcea, Bernhard Schölkopf, Mrinmaya Sachan. 9353-9372 [doi]

PEDANTS: Cheap but Effective and Interpretable Answer EquivalenceZongxia Li, Ishani Mondal, Huy Nghiem, Yijun Liang, Jordan L. Boyd-Graber. 9373-9398 [doi]

AgentsCourt: Building Judicial Decision-Making Agents with Court Debate Simulation and Legal Knowledge AugmentationZhitao He, Pengfei Cao, Chenhao Wang, Zhuoran Jin, Yubo Chen 0001, Jiexin Xu, Huaijun Li, Kang Liu 0001, Jun Zhao 0001. 9399-9416 [doi]

Editing the Mind of Giants: An In-Depth Exploration of Pitfalls of Knowledge Editing in Large Language ModelsCheng-Hsun Hsueh, Paul Kuo-Ming Huang, Tzu-Han Lin, Che-Wei Liao, Hung-Chieh Fang, Chao-Wei Huang, Yun-Nung Chen. 9417-9429 [doi]

Improving LLM Attributions with Randomized Path-IntegrationOren Barkan, Yehonatan Elisha, Yonatan Toib, Jonathan Weill, Noam Koenigstein. 9430-9446 [doi]

VeriScore: Evaluating the factuality of verifiable claims in long-form text generationYixiao Song, Yekyung Kim, Mohit Iyyer. 9447-9474 [doi]

Instruct, Not Assist: LLM-based Multi-Turn Planning and Hierarchical Questioning for Socratic Code DebuggingPriyanka Kargupta, Ishika Agarwal, Dilek Hakkani-Tür, Jiawei Han 0001. 9475-9495 [doi]

Tutor-ICL: Guiding Large Language Models for Improved In-Context Learning PerformanceIkhyun Cho, Gaeul Kwon, Julia Hockenmaier. 9496-9506 [doi]

Taking a turn for the better: Conversation redirection throughout the course of mental-health therapyVivian Nguyen, Sang Jung, Lillian Lee, Thomas D. Hull, Cristian Danescu-Niculescu-Mizil. 9507-9521 [doi]

LLM Explainability via Attributive Masking LearningOren Barkan, Yonatan Toib, Yehonatan Elisha, Jonathan Weill, Noam Koenigstein. 9522-9537 [doi]

How Entangled is Factuality and Deception in German?Aswathy Velutharambath, Amelie Wührl, Roman Klinger. 9538-9554 [doi]

Train Once, Use Flexibly: A Modular Framework for Multi-Aspect Neural News RecommendationAndreea Iana, Goran Glavas, Heiko Paulheim. 9555-9571 [doi]

A LLM-based Ranking Method for the Evaluation of Automatic Counter-Narrative GenerationIrune Zubiaga, Aitor Soroa, Rodrigo Agerri. 9572-9585 [doi]

A Survey on Open Information Extraction from Rule-based Model to Large Language ModelPai Liu, Wenyang Gao, Wenjie Dong, Lin Ai, Ziwei Gong, Songfang Huang, Zongsheng Li, Ehsan Hoque, Julia Hirschberg, Yue Zhang 0004. 9586-9608 [doi]

Enhancing Tool Retrieval with Iterative Feedback from Large Language ModelsQiancheng Xu, Yongqi Li 0001, Heming Xia, Wenjie Li 0002. 9609-9619 [doi]

Detecting Temporal Ambiguity in QuestionsBhawna Piryani, Abdelrahman Abdallah, Jamshid Mozafari, Adam Jatowt. 9620-9634 [doi]

LaMDA: Large Model Fine-Tuning via Spectrally Decomposed Low-Dimensional AdaptationSeyedarmin Azizi, Souvik Kundu 0002, Massoud Pedram. 9635-9646 [doi]

Machine Translation Hallucination Detection for Low and High Resource Languages using Large Language ModelsKenza Benkirane, Laura Gongas, Shahar Pelles, Naomi Fuchs, Joshua Darmon, Pontus Stenetorp, David Ifeoluwa Adelani, Eduardo Sánchez. 9647-9665 [doi]

Navigating Hallucinations for Reasoning of Unintentional ActivitiesShresth Grover, Vibhav Vineet, Yogesh S. Rawat. 9666-9680 [doi]

Pruning Foundation Models for High Accuracy without RetrainingPu Zhao, Fei Sun, Xuan Shen, Pinrui Yu, Zhenglun Kong, Yanzhi Wang, Xue Lin. 9681-9694 [doi]

From Pixels to Personas: Investigating and Modeling Self-Anthropomorphism in Human-Robot DialoguesYu Li, Devamanyu Hazarika, Di Jin, Julia Hirschberg, Yang Liu 0004. 9695-9713 [doi]

DisGeM: Distractor Generation for Multiple Choice Questions with Span MaskingDevrim Çavusoglu, Seçil Sen, Ulas Sert. 9714-9732 [doi]

ChatGLM-Math: Improving Math Problem-Solving in Large Language Models with a Self-Critique PipelineYifan Xu, Xiao Liu 0036, Xinghan Liu, Zhenyu Hou, Yueyan Li, Xiaohan Zhang, Zihan Wang, Aohan Zeng, Zhengxiao Du, Wenyi Zhao, Jie Tang 0001, Yuxiao Dong. 9733-9760 [doi]

MobileQuant: Mobile-friendly Quantization for On-device Language ModelsFuwen Tan, Royson Lee, Lukasz Dudziak, Shell Xu Hu, Sourav Bhattacharya, Timothy M. Hospedales, Georgios Tzimiropoulos, Brais Martínez. 9761-9771 [doi]

Do *they* mean 'us'? Interpreting Referring Expression variation under Intergroup BiasVenkata S. Govindarajan, Matianyu Zang, Kyle Mahowald, David Beaver, Junyi Jessy Li. 9772-9785 [doi]

A Survey on Detection of LLMs-Generated ContentXianjun Yang, Liangming Pan, Xuandong Zhao, Haifeng Chen, Linda R. Petzold, William Yang Wang, Wei Cheng 0002. 9786-9805 [doi]

Can LLMs Reason in the Wild with Programs?Yuan Yang, Siheng Xiong, Ali Payani, Ehsan Shareghi, Faramarz Fekri. 9806-9829 [doi]

Can Textual Unlearning Solve Cross-Modality Safety Alignment?Trishna Chakraborty, Erfan Shayegani, Zikui Cai, Nael B. Abu-Ghazaleh, M. Salman Asif, Yue Dong 0002, Amit K. Roy Chowdhury, Chengyu Song. 9830-9844 [doi]

VDebugger: Harnessing Execution Feedback for Debugging Visual ProgramsXueqing Wu 0001, Zongyu Lin, Songyan Zhao, Te-Lin Wu, Pan Lu, Nanyun Peng, Kai-Wei Chang. 9845-9860 [doi]

Monotonic Paraphrasing Improves Generalization of Language Model PromptingQin Liu, Fei Wang, Nan Xu, Tianyi Yan, Tao Meng, Muhao Chen. 9861-9877 [doi]

MORL-Prompt: An Empirical Analysis of Multi-Objective Reinforcement Learning for Discrete Prompt OptimizationYasaman Jafari, Dheeraj Mekala, Rose Yu, Taylor Berg-Kirkpatrick. 9878-9889 [doi]

Understanding Faithfulness and Reasoning of Large Language Models on Plain Biomedical SummariesBiaoyan Fang, Xiang Dai, Sarvnaz Karimi. 9890-9911 [doi]

Change Is the Only Constant: Dynamic LLM Slicing based on Layer RedundancyRazvan Gabriel Dumitru, Paul-Ioan Clotan, Vikas Yadav, Darius Peteleaza, Mihai Surdeanu. 9912-9920 [doi]

Pruning Multilingual Large Language Models for Multilingual InferenceHwichan Kim, Jun Suzuki 0001, Tosho Hirasawa, Mamoru Komachi. 9921-9942 [doi]

Video Discourse Parsing and Its Application to Multimodal Summarization: A Dataset and Baseline ApproachesTsutomu Hirao, Naoki Kobayashi, Hidetaka Kamigaito, Manabu Okumura, Akisato Kimura. 9943-9958 [doi]

Length Extrapolation of Transformers: A Survey from the Perspective of Positional EncodingLiang Zhao, Xiachong Feng, Xiaocheng Feng, Weihong Zhong, Dongliang Xu, Qing Yang 0033, Hongtao Liu, Bing Qin 0001, Ting Liu 0001. 9959-9977 [doi]

VPL: Visual Proxy Learning Framework for Zero-Shot Medical Image DiagnosisJiaxiang Liu, Tianxiang Hu, Huimin Xiong, Jiawei Du, Yang Feng, Jian Wu 0001, Joey Zhou, Zuozhu Liu. 9978-9992 [doi]

Word-Conditioned 3D American Sign Language Motion GenerationLu Dong 0004, Xiao Wang, Ifeoma Nwogu. 9993-9999 [doi]

TrustAgent: Towards Safe and Trustworthy LLM-based AgentsWenyue Hua, Xianjun Yang, Mingyu Jin, Zelong Li, Wei Cheng 0002, Ruixiang Tang, Yongfeng Zhang. 10000-10016 [doi]

Enabling Cross-Platform Comparison of Online Communities Using Content and Opinion SimilarityPrasanna Lakkur Subramanyam, Jeng-Yu Chou, Kevin Nam, Brian Levine. 10017-10028 [doi]

CNEQ: Incorporating numbers into Knowledge Graph ReasoningXianshu Peng, Wei Wei 0002, Kaihe Xu, Dangyang Chen. 10029-10042 [doi]

StraGo: Harnessing Strategic Guidance for Prompt OptimizationYurong Wu, Yan Gao, Bin Zhu, Zineng Zhou, Xiaodi Sun, Sheng Yang, Jian-Guang Lou, Zhiming Ding, Linjun Yang. 10043-10061 [doi]

Learning to Plan by Updating Natural LanguageYiduo Guo, Yaobo Liang, Chenfei Wu, Wenshan Wu, Dongyan Zhao 0001, Nan Duan. 10062-10098 [doi]

C-ICL: Contrastive In-context Learning for Information ExtractionYing Mo, Jiahao Liu, Jian Yang, Qifan Wang, Shun Zhang, Jingang Wang, Zhoujun Li. 10099-10114 [doi]

On the Similarity of Circuits across Languages: a Case Study on the Subject-verb Agreement TaskJavier Ferrando, Marta R. Costa-Jussà. 10115-10125 [doi]

Can LLM be a Personalized Judge?Yijiang River Dong, Tiancheng Hu, Nigel Collier. 10126-10141 [doi]

Who's Who: Large Language Models Meet Knowledge Conflicts in PracticeQuang Pham, Hoang Ngo, Anh Tuan Luu, Dat Quoc Nguyen. 10142-10151 [doi]

Unleashing the Potentials of Likelihood Composition for Multi-modal Language ModelsShitian Zhao, Renrui Zhang, Xu Luo, Yan Wang, Shanghang Zhang, Peng Gao 0007. 10152-10163 [doi]

Automated Peer Reviewing in Paper SEA: Standardization, Evaluation, and AnalysisJianxiang Yu 0001, Zichen Ding 0002, Jiaqi Tan 0006, Kangyang Luo, Zhenmin Weng, Chenghua Gong, Long Zeng, Renjing Cui, Chengcheng Han 0004, Qiushi Sun, Zhiyong Wu 0003, Yunshi Lan, Xiang Li 0067. 10164-10184 [doi]

Knowledge-based Consistency Testing of Large Language ModelsSai Sathiesh Rajan, Ezekiel Olamide Soremekun, Sudipta Chattopadhyay 0001. 10185-10196 [doi]

PRESTO: Progressive Pretraining Enhances Synthetic Chemistry OutcomesHe Cao, Yanjun Shao, Zhiyuan Liu, Zijing Liu, Xiangru Tang, Yuan Yao, Yu Li. 10197-10224 [doi]

Query Routing for Homogeneous Tools: An Instantiation in the RAG ScenarioFeiteng Mu, Yong Jiang, Liwen Zhang, Chu Liu, Wenjie Li, Pengjun Xie, Fei Huang. 10225-10230 [doi]

MobileVLM: A Vision-Language Model for Better Intra- and Inter-UI UnderstandingQinzhuo Wu, Weikai Xu, Wei Liu 0005, Tao Tan, Jianfeng Liu 0005, Ang Li, Jian Luan 0001, Bin Wang 0004, Shuo Shang. 10231-10251 [doi]

Schema-Driven Information Extraction from Heterogeneous TablesFan Bai 0006, Junmo Kang, Gabriel Stanovsky, Dayne Freitag, Mark Dredze, Alan Ritter. 10252-10273 [doi]

Is There a One-Model-Fits-All Approach to Information Extraction? Revisiting Task Definition BiasesWenhao Huang, Qianyu He, Zhixu Li, Jiaqing Liang, Yanghua Xiao. 10274-10287 [doi]

PromptIntern: Saving Inference Costs by Internalizing Recurrent Prompt during Large Language Model Fine-tuningJiaru Zou, Mengyu Zhou, Tao Li, Shi Han, Dongmei Zhang 0001. 10288-10305 [doi]

TAP4LLM: Table Provider on Sampling, Augmenting, and Packing Semi-structured Data for Large Language Model ReasoningYuan Sui, Jiaru Zou, Mengyu Zhou, Xinyi He, Lun Du, Shi Han, Dongmei Zhang 0001. 10306-10323 [doi]

In2Core: Leveraging Influence Functions for Coreset Selection in Instruction Finetuning of Large Language ModelsAyrton San Joaquin, Bin Wang, Zhengyuan Liu, Philippe Muller, Nicholas Asher, Brian Lim, Nancy F. Chen. 10324-10335 [doi]

How Personality Traits Influence Negotiation Outcomes? A Simulation based on Large Language ModelsYin Jou Huang, Rafik Hadfi. 10336-10351 [doi]

Introducing Spatial Information and a Novel Evaluation Scheme for Open-Domain Live Commentary GenerationErica K. Shimomoto, Edison Marrese-Taylor, Ichiro Kobayashi, Hiroya Takamura, Yusuke Miyao. 10352-10370 [doi]

Retrieving, Rethinking and Revising: The Chain-of-Verification Can Improve Retrieval Augmented GenerationBolei He, Nuo Chen, Xinran He, Lingyong Yan, Zhenkai Wei, Jinchang Luo, Zhen-Hua Ling. 10371-10393 [doi]

Detecting Machine-Generated Long-Form Content with Latent-Space VariablesYufei Tian, Zeyu Pan, Nanyun Peng. 10394-10408 [doi]

Learning to Match Representations is Better for End-to-End Task-Oriented Dialog SystemWanshi Xu, Xuxin Cheng, Zhihong Zhu, Zhanpeng Chen, Yuexian Zou. 10409-10419 [doi]

ShieldLM: Empowering LLMs as Aligned, Customizable and Explainable Safety DetectorsZhexin Zhang, Yida Lu, Jingyuan Ma, Di Zhang, Rui Li, Pei Ke, Hao Sun, Lei Sha, Zhifang Sui, Hongning Wang, Minlie Huang. 10420-10438 [doi]

BiasDora: Exploring Hidden Biased Associations in Vision-Language ModelsChahat Raj, Anjishnu Mukherjee, Aylin Caliskan, Antonios Anastasopoulos, Ziwei Zhu 0001. 10439-10455 [doi]

MoE-I²: Compressing Mixture of Experts Models through Inter-Expert Pruning and Intra-Expert Low-Rank DecompositionCheng Yang, Yang Sui, Jinqi Xiao, Lingyi Huang, Yu Gong, Yuanlin Duan, Wenqi Jia 0003, Miao Yin, Yu Cheng, Bo Yuan 0001. 10456-10466 [doi]

Multimodal Misinformation Detection by Learning from Synthetic Data with Multimodal LLMsFengzhu Zeng, Wenqian Li, Wei Gao, Yan Pang. 10467-10484 [doi]

Exploring Design Choices for Building Language-Specific LLMsAtula Tejaswi, Nilesh Gupta, Eunsol Choi. 10485-10500 [doi]

Promoting Data and Model Privacy in Federated Learning through Quantized LoRAJianhao Zhu, Changze Lv, Xiaohua Wang, Muling Wu, Wenhao Liu, Tianlong Li, Zixuan Ling, Cenyuan Zhang, Xiaoqing Zheng, Xuanjing Huang 0001. 10501-10512 [doi]

Intended Target Identification for Anomia Patients with Gradient-based Selective AugmentationJongho Kim, Romain Storaï, Seung-won Hwang. 10513-10527 [doi]

Fine-tuning Smaller Language Models for Question Answering over Financial DocumentsKarmvir Singh Phogat, Sai Akhil Puranam, Sridhar Dasaratha, Chetan Harsha, Shashishekar Ramakrishna. 10528-10548 [doi]

Beyond Fine-tuning: Unleashing the Potential of Continuous Pretraining for Clinical LLMsClément Christophe, Tathagata Raha, Svetlana Maslenkova, Muhammad Umar Salman, Praveen K. Kanithi, Marco AF Pimentel, Shadab Khan. 10549-10561 [doi]

MedCare: Advancing Medical LLMs through Decoupling Clinical Alignment and Knowledge AggregationYusheng Liao, Shuyang Jiang, Zhe Chen, Yanfeng Wang 0001, Yu Wang 0027. 10562-10581 [doi]

Interpretable Preferences via Multi-Objective Reward Modeling and Mixture-of-ExpertsHaoxiang Wang 0003, Wei Xiong 0015, Tengyang Xie, Han Zhao 0002, Tong Zhang 0001. 10582-10592 [doi]

Code Membership Inference for Detecting Unauthorized Data Use in Code Pre-trained Language ModelsSheng Zhang, Hui Li 0057, Rongrong Ji. 10593-10603 [doi]

Learning When to Retrieve, What to Rewrite, and How to Respond in Conversational QANirmal Roy, Leonardo F. R. Ribeiro, Rexhina Blloshmi, Kevin Small. 10604-10625 [doi]

Beyond Natural Language: LLMs Leveraging Alternative Formats for Enhanced Reasoning and CommunicationWeize Chen, Chenfei Yuan, Jiarui Yuan, Yusheng Su, Chen Qian, Cheng Yang 0002, Ruobing Xie, Zhiyuan Liu 0001, Maosong Sun 0001. 10626-10641 [doi]

Learning to Use Tools via Cooperative and Interactive AgentsZhengliang Shi, Shen Gao, Xiuyi Chen, Yue Feng, Lingyong Yan, Haibo Shi, Dawei Yin, Pengjie Ren, Suzan Verberne, Zhaochun Ren. 10642-10657 [doi]

STARD: A Chinese Statute Retrieval Dataset Derived from Real-life Queries by Non-professionalsWeihang Su, Yiran Hu, Anzhe Xie, Qingyao Ai, Quezi Bing, Ning Zheng, Yun Liu, Weixing Shen, Yiqun Liu 0001. 10658-10671 [doi]

What if...?: Thinking Counterfactual Keywords Helps to Mitigate Hallucination in Large Multi-modal ModelsJunho Kim, Yeonju Kim, Yong Man Ro. 10672-10689 [doi]

MELT: Materials-aware Continued Pre-training for Language Model Adaptation to Materials ScienceJunho Kim, Yeachan Kim, Jun-Hyung Park, Yerim Oh, SuHo Kim, SangKeun Lee 0001. 10690-10703 [doi]

PDF-to-Tree: Parsing PDF Text Blocks into a TreeYue Zhang 0004, Zhihao Zhang, Wenbin Lai, Chong Zhang, Tao Gui, Qi Zhang 0001, Xuanjing Huang 0001. 10704-10714 [doi]

Seeing Through VisualBERT: A Causal Adventure on Memetic LandscapesDibyanayan Bandyopadhyay, Mohammed Hasanuzzaman, Asif Ekbal. 10715-10731 [doi]

Cross-Lingual Unlearning of Selective Knowledge in Multilingual Language ModelsMinseok Choi, Kyunghyun Min, Jaegul Choo. 10732-10747 [doi]

LLaMAX: Scaling Linguistic Horizons of LLM by Enhancing Translation Capabilities Beyond 100 LanguagesYinquan Lu, Wenhao Zhu, Lei Li 0005, Yu Qiao, Fei Yuan. 10748-10772 [doi]

Enhancing Emotion-Cause Pair Extraction in Conversations via Center Event Detection and ReasoningBotao Wang, Keke Tang, Peican Zhu. 10773-10783 [doi]

Light-weight Fine-tuning Method for Defending Adversarial Noise in Pre-trained Medical Vision-Language ModelsXu Han, Linghao Jin, Xuezhe Ma, Xiaofeng Liu 0001. 10784-10799 [doi]

Together We Can: Multilingual Automatic Post-Editing for Low-Resource LanguagesSourabh Dattatray Deoghare, Diptesh Kanojia, Pushpak Bhattacharyya. 10800-10812 [doi]

CERT-ED: Certifiably Robust Text Classification for Edit DistanceZhuoqun Huang, Neil G. Marchant, Olga Ohrimenko, Benjamin I. P. Rubinstein. 10813-10835 [doi]

Ask-before-Plan: Proactive Language Agents for Real-World PlanningXuan Zhang, Yang Deng 0002, Zifeng Ren, See-Kiong Ng, Tat-Seng Chua. 10836-10863 [doi]

From Complex to Simple: Enhancing Multi-Constraint Complex Instruction Following Ability of Large Language ModelsQianyu He, Jie Zeng, Qianxi He, Jiaqing Liang, Yanghua Xiao. 10864-10882 [doi]

FlowBench: Revisiting and Benchmarking Workflow-Guided Planning for LLM-based AgentsRuixuan Xiao, Wentao Ma, Ke Wang, Yuchuan Wu, Junbo Zhao 0002, Haobo Wang, Fei Huang 0004, Yongbin Li. 10883-10900 [doi]

Mental Disorder Classification via Temporal Representation of TextRaja Kumar, Kishan Maharaj, Ashita Saxena, Pushpak Bhattacharyya. 10901-10916 [doi]

Beyond Single-Audio: Advancing Multi-Audio Processing in Audio Large Language ModelsYiming Chen, Xianghu Yue, Xiaoxue Gao, Chen Zhang 0020, Luis Fernando D'Haro, Robby T. Tan, Haizhou Li 0001. 10917-10930 [doi]

Multimodal Procedural Planning via Dual Text-Image PromptingYujie Lu, Pan Lu, Zhiyu Chen 0002, Wanrong Zhu, Xin Wang 0061, William Yang Wang. 10931-10954 [doi]

Functionality learning through specification instructionsPedro Henrique Luz de Araujo, Benjamin Roth 0001. 10955-10990 [doi]

DictDis: Dictionary Constrained Disambiguation for Improved NMTAyush Maheshwari, Preethi Jyothi, Ganesh Ramakrishnan. 10991-11004 [doi]

Fighting Randomness with Randomness: Mitigating Optimisation Instability of Fine-Tuning using Delayed Ensemble and Noisy InterpolationBranislav Pecher, Ján Cegin, Róbert Belanec, Jakub Simko, Ivan Srba, Mária Bieliková. 11005-11044 [doi]

Rethinking Code Refinement: Learning to Judge Code EfficiencyMinju Seo, Jinheon Baek, Sung Ju Hwang. 11045-11056 [doi]

Selection-p: Self-Supervised Task-Agnostic Prompt Compression for Faithfulness and TransferabilityTsz Ting Chung, Leyang Cui, Lemao Liu, Xinting Huang, Shuming Shi 0001, Dit-Yan Yeung. 11057-11070 [doi]

Adaptive Token Biaser: Knowledge Editing via Biasing Key EntitiesBaolong Bi, Shenghua Liu, Yiwei Wang, Lingrui Mei, Hongcheng Gao, Yilong Xu, Xueqi Cheng. 11071-11083 [doi]

Improving Factual Consistency of News Summarization by Contrastive Preference OptimizationHuawen Feng, Yan Fan, Xiong Liu, Ting-En Lin, Zekun Yao, Yuchuan Wu, Fei Huang 0004, Yongbin Li, Qianli Ma 0001. 11084-11100 [doi]

AlanaVLM: A Multimodal Embodied AI Foundation Model for Egocentric Video UnderstandingAlessandro Suglia, Claudio Greco 0002, Katie Baker, Jose L. Part, Ioannis Papaioannou, Arash Eshghi, Ioannis Konstas, Oliver Lemon. 11101-11122 [doi]

Platform-Invariant Topic Modeling via Contrastive Learning to Mitigate Platform-Induced BiasMinseo Koo, Doeun Kim, Sungwon Han 0001, Sungkyu Park. 11123-11139 [doi]

MAVEN-FACT: A Large-scale Event Factuality Detection DatasetChunyang Li, Hao Peng 0015, Xiaozhi Wang, Yunjia Qi, Lei Hou 0001, Bin Xu 0001, Juanzi Li. 11140-11158 [doi]

Retrieval-Augmented Code Generation for Situated Action Generation: A Case Study on MinecraftKranti Chalamalasetti, Sherzod Hakimov, David Schlangen. 11159-11170 [doi]

Make Compound Sentences Simple to Analyze: Learning to Split Sentences for Aspect-based Sentiment AnalysisYongsik Seo, Sungwon Song, Ryang Heo, Jieyong Kim, Dongha Lee 0003. 11171-11184 [doi]

LLMs-as-Instructors: Learning from Errors Toward Automating Model ImprovementJiahao Ying, Mingbao Lin, Yixin Cao 0002, Wei Tang 0015, Bo Wang, Qianru Sun, Xuanjing Huang 0001, Shuicheng Yan. 11185-11208 [doi]

ITER: Iterative Transformer-based Entity Recognition and Relation ExtractionMoritz Hennen, Florian Babl, Michaela Geierhos. 11209-11223 [doi]

Zero-shot Persuasive Chatbots with LLM-Generated Strategies and Information RetrievalKazuaki Furumai, Roberto Legaspi, Julio Romero, Yudai Yamazaki, Yasutaka Nishimura, Sina J. Semnani, Kazushi Ikeda, Weiyan Shi, Monica S. Lam. 11224-11249 [doi]

Logits Reranking via Semantic Labels for Hard Samples in Text ClassificationPeijie Huang, Junbao Huang, Yuhong Xu, Weizhen Li, Xisheng Xiao. 11250-11262 [doi]

Scaling Laws for Fact Memorization of Large Language ModelsXingyu Lu, Xiaonan Li, Qinyuan Cheng, Kai Ding, Xuanjing Huang 0001, Xipeng Qiu. 11263-11282 [doi]

Breaking the Script Barrier in Multilingual Pre-Trained Language Models with Transliteration-Based Post-Training AlignmentOrgest Xhelili, Yihong Liu, Hinrich Schütze. 11283-11296 [doi]

Leveraging Web-Crawled Data for High-Quality Fine-TuningJing Zhou, Chenglin Jiang, Wei Shen 0005, Xiao Zhou, Xiaonan He. 11297-11312 [doi]

Designing Logic Pattern Templates for Counter-Argument Logical Structure AnalysisShoichi Naito, Wenzhi Wang, Paul Reisert, Naoya Inoue, Camélia Guerraoui, Kenshi Yamaguchi, Jungmin Choi, Irfan Robbani, Surawat Pothong, Kentaro Inui. 11313-11331 [doi]

Optimize Weight Rounding via Signed Gradient Descent for the Quantization of LLMsWenhua Cheng, Weiwei Zhang, Haihao Shen, Yiyang Cai, Xin He, Kaokao Lv, Yi Liu. 11332-11350 [doi]

Using LLMs to simulate students' responses to exam questionsLuca Benedetto, Giovanni Aradelli, Antonia Donvito, Alberto Lucchetti, Andrea Cappelli, Paula Buttery. 11351-11368 [doi]

HSDreport: Heart Sound Diagnosis with Echocardiography ReportsZihan Zhao, Pingjie Wang, Liudan Zhao, Yuchen Yang, Ya Zhang, Kun Sun, Xin Sun, Xin Zhou, Yu Wang, Yanfeng Wang. 11369-11378 [doi]

Repairing Catastrophic-Neglect in Text-to-Image Diffusion Models via Attention-Guided Feature EnhancementZhiyuan Chang, Mingyang Li, Junjie Wang, Yi Liu, Qing Wang, Yang Liu. 11379-11390 [doi]

Where Visual Speech Meets Language: VSP-LLM Framework for Efficient and Context-Aware Visual Speech ProcessingJeong Hun Yeo, Seunghee Han, Minsu Kim 0001, Yong Man Ro. 11391-11406 [doi]

MDCR: A Dataset for Multi-Document Conditional ReasoningPeter Baile Chen, Yi Zhang, Chunwei Liu, Sejal Gupta, Yoon Kim, Mike Cafarella. 11407-11424 [doi]

Will LLMs Sink or Swim? Exploring Decision-Making Under PressureKyusik Kim, Hyeonseok Jeon, Jeongwoo Ryu, Bongwon Suh. 11425-11450 [doi]

Zero-shot Commonsense Reasoning over Machine ImaginationHyuntae Park, Yeachan Kim, Jun-Hyung Park, SangKeun Lee 0001. 11451-11471 [doi]

A Framework of Knowledge Graph-Enhanced Large Language Model Based on Question Decomposition and Atomic RetrievalYading Li, Dandan Song, Changzhi Zhou, Yuhang Tian, Hao Wang 0163, Ziyi Yang, Shuhao Zhang. 11472-11485 [doi]

Vanessa: Visual Connotation and Aesthetic Attributes Understanding Network for Multimodal Aspect-based Sentiment AnalysisLuwei Xiao, Rui Mao 0010, Xulang Zhang, Liang He, Erik Cambria. 11486-11500 [doi]

Consistent Document-level Relation Extraction via CounterfactualsAli Modarressi, Abdullatif Köksal, Hinrich Schütze. 11501-11507 [doi]

Enhancing Learning-Based Binary Code Similarity Detection Model through Adversarial Training with Multiple Function VariantsLichen Jia, Chenggang Wu 0002, Bowen Tang, Peihua Zhang, Zihan Jiang, Yang Yang, Ning Liu, Jingfeng Zhang, Zhe Wang 0017. 11508-11518 [doi]

Ask the experts: sourcing a high-quality nutrition counseling dataset through Human-AI collaborationSimone Balloccu, Ehud Reiter, Karen Li, Rafael Sargsyan, Vivek Kumar 0007, Diego Reforgiato Recupero, Daniele Riboni, Ondrej Dusek. 11519-11545 [doi]

HealthAlignSumm : Utilizing Alignment for Multimodal Summarization of Code-Mixed Healthcare DialoguesAkash Ghosh, Arkadeep Acharya, Sriparna Saha 0001, Gaurav Pandey 0001, Dinesh Raghu, Setu Sinha. 11546-11560 [doi]

Revisiting the Impact of Pursuing Modularity for Code GenerationDeokyeong Kang, Ki Jung Seo, Taeuk Kim. 11561-11571 [doi]

A Decoding Algorithm for Length-Control Summarization Based on Directed Acyclic TransformersChenyang Huang 0001, Hao Zhou 0012, Cameron Jen, Kangjie Zheng, Osmar R. Zaïane, Lili Mou. 11572-11583 [doi]

R²AG: Incorporating Retrieval Information into Retrieval Augmented GenerationFuda Ye, Shuangyin Li, Yongqi Zhang, Lei Chen 0002. 11584-11596 [doi]

Not (yet) the whole story: Evaluating Visual Storytelling Requires More than Measuring Coherence, Grounding, and RepetitionAditya Kaushik Surikuchi, Raquel Fernández, Sandro Pezzelle. 11597-11611 [doi]

Gender Identity in Pretrained Language Models: An Inclusive Approach to Data Creation and ProbingUrban Knuples, Agnieszka Falenska, Filip Miletic 0002. 11612-11631 [doi]

“Vorbești Românește?” A Recipe to Train Powerful Romanian LLMs with English InstructionsMihai Masala, Denis C. Ilie-Ablachim, Alexandru Dima, Dragos-Georgian Corlatescu, Miruna-Andreea Zavelca, Ovio Olaru, Simina-Maria Terian, Andrei Terian, Marius Leordeanu, Horia Velicu, Marius Popescu, Mihai Dascalu, Traian Rebedea. 11632-11647 [doi]

Generalized Measures of Anticipation and Responsivity in Online Language ProcessingMario Giulianelli, Andreas Opedal, Ryan Cotterell. 11648-11669 [doi]

Towards Effective Counter-Responses: Aligning Human Preferences with Strategies to Combat Online TrollingHuije Lee, Hoyun Song, Jisu Shin, Sukmin Cho, Seungyoon Han, Jong Park. 11670-11686 [doi]

Soda-Eval: Open-Domain Dialogue Evaluation in the age of LLMsJohn Mendonça, Isabel Trancoso, Alon Lavie. 11687-11708 [doi]

A Comprehensive Survey of Hallucination in Large Language, Image, Video and Audio Foundation ModelsPranab Sahoo, Prabhash Meharia, Akash Ghosh, Sriparna Saha 0001, Vinija Jain, Aman Chadha. 11709-11724 [doi]

Predicting generalization performance with correctness discriminatorsYuekun Yao, Alexander Koller. 11725-11739 [doi]

FastMem: Fast Memorization of Prompt Improves Context Awareness of Large Language ModelsJunyi Zhu 0002, Shuochen Liu, Yu Yu, Bo Tang, Yibo Yan, Zhiyu Li, Feiyu Xiong, Tong Xu, Matthew B. Blaschko. 11740-11758 [doi]

Towards More Robust NLP System Evaluation: Handling Missing Scores in BenchmarksAnas Himmi, Ekhine Irurozki, Nathan Noiry, Stéphan Clémençon, Pierre Colombo. 11759-11785 [doi]

Mixed-Session Conversation with Egocentric MemoryJihyoung Jang, Taeyoung Kim, Hyounghun Kim. 11786-11815 [doi]

CSLM: A Framework for Question Answering Dataset Generation through Collaborative Small Language ModelsYiming Wang, Yang Liu, Lingchen Wang, An Xiao. 11816-11825 [doi]

Large Language Models Can Not Perform Well in Understanding and Manipulating Natural Language at Both Character and Word Levels?Yidan Zhang, Zhenan He 0001. 11826-11842 [doi]

Virtual Context Enhancing Jailbreak Attacks with Special Token InjectionYuqi Zhou, Lin Lu, Ryan Sun, Pan Zhou 0001, Lichao Sun 0001. 11843-11857 [doi]

Think Twice Before Trusting: Self-Detection for Large Language Models through Comprehensive Answer ReflectionMoxin Li, Wenjie Wang 0007, Fuli Feng, Fengbin Zhu, Qifan Wang, Tat-Seng Chua. 11858-11875 [doi]

Automating Easy Read Text SegmentationJesus Calleja, Thierry Etchegoyhen, Antonio David Ponce Martínez. 11876-11894 [doi]

Position Paper: Data-Centric AI in the Age of Large Language ModelsXinyi Xu, Zhaoxuan Wu, Rui Qiao 0006, Arun Verma, Yao Shu, Jingtan Wang, Xinyuan Niu, Zhenfeng He, Jiangwei Chen, Zijian Zhou, Gregory Kang Ruey Lau, Hieu Dao, Lucas Agussurja, Rachael Hwee Ling Sim, Xiaoqiang Lin, Wenyang Hu, Zhongxiang Dai, Pang Wei Koh, Bryan Kian Hsiang Low. 11895-11913 [doi]

MATHWELL: Generating Educational Math Word Problems Using Teacher AnnotationsBryan R. Christ, Jonathan Kropko, Thomas Hartvigsen. 11914-11938 [doi]

Resilience of Large Language Models for Noisy InstructionsBin Wang, Chengwei Wei, Zhengyuan Liu, Geyu Lin, Nancy Chen. 11939-11950 [doi]

LLM-TOPLA: Efficient LLM Ensemble by Maximising DiversitySelim F. Tekin, Fatih Ilhan, Tiansheng Huang, Sihao Hu, Ling Liu 0001. 11951-11966 [doi]

Augmenting Reasoning Capabilities of LLMs with Graph Structures in Knowledge Base Question AnsweringYuhang Tian, Dandan Song, Zhijing Wu 0001, Changzhi Zhou, Hao Wang 0163, Jun Yang, Jing Xu, Ruanmin Cao, Haoyu Wang. 11967-11977 [doi]

Creative Problem Solving in Large Language and Vision Models - What Would it Take?Lakshmi Nair 0001, Evana Gizzi, Jivko Sinapov. 11978-11994 [doi]

Cross-Lingual Multi-Hop Knowledge EditingAditi Khandelwal, Harman Singh, Hengrui Gu 0002, Tianlong Chen, Kaixiong Zhou. 11995-12015 [doi]

Android in the Zoo: Chain-of-Action-Thought for GUI AgentsJiwen Zhang, Jihao Wu, Yihua Teng, Minghui Liao, Nuo Xu, Xiao Xiao, Zhongyu Wei, Duyu Tang. 12016-12031 [doi]

Self-Recognition in Language ModelsTim R. Davidson, Viacheslav Surkov, Veniamin Veselovsky, Giuseppe Russo Latona, Robert West 0001, Caglar Gulcehre. 12032-12059 [doi]

Beyond Accuracy Optimization: Computer Vision Losses for Large Language Model Fine-TuningDaniele Rege Cambrin, Giuseppe Gallipoli, Irene Benedetto, Luca Cagliero, Paolo Garza. 12060-12079 [doi]

The Shape of Word Embeddings: Quantifying Non-Isometry with Topological Data AnalysisOndrej Draganov, Steven Skiena. 12080-12099 [doi]

Towards Robust Evaluation of Unlearning in LLMs via Data TransformationsAbhinav Joshi, Shaswati Saha, Divyaksh Shukla, Sriram Vema, Harsh Jhamtani, Manas Gaur, Ashutosh Modi. 12100-12119 [doi]

Numbers Matter! Bringing Quantity-awareness to Retrieval SystemsSatya Almasian, Milena Bruseva, Michael Gertz 0001. 12120-12136 [doi]

Stark: Social Long-Term Multi-Modal Conversation with Persona Commonsense KnowledgeYoung-Jun Lee, Dokyong Lee, Junyoung Youn, Kyeongjin Oh, ByungSoo Ko, Jonghwan Hyeon, Ho-Jin Choi. 12137-12162 [doi]

Dual-Phase Accelerated Prompt OptimizationMuchen Yang, Moxin Li, Yongle Li, Zijun Chen, Chongming Gao, Junqi Zhang, Yangyang Li, Fuli Feng. 12163-12173 [doi]

ChartInsights: Evaluating Multimodal Large Language Models for Low-Level Chart Question AnsweringYifan Wu, Lutao Yan, Leixian Shen, Yunhai Wang, Nan Tang 0001, Yuyu Luo. 12174-12200 [doi]

Communicate to Play: Pragmatic Reasoning for Efficient Cross-Cultural CommunicationIsadora White, Sashrika Pandey, Michelle Pan. 12201-12216 [doi]

SAFARI: Cross-lingual Bias and Factuality Detection in News Media and News ArticlesDilshod Azizov, Zain Muhammad Mujahid, Hilal AlQuabeh, Preslav Nakov, Shangsong Liang. 12217-12231 [doi]

CantTalkAboutThis: Aligning Language Models to Stay on Topic in DialoguesMakesh Narsimhan Sreedhar, Traian Rebedea, Shaona Ghosh, Jiaqi Zeng, Christopher Parisien. 12232-12252 [doi]

An LLM-Enabled Knowledge Elicitation and Retrieval Framework for Zero-Shot Cross-Lingual Stance IdentificationRuike Zhang, Yuan Tian, Penghui Wei, Daniel Zeng 0001, Wenji Mao. 12253-12266 [doi]

TuringQ: Benchmarking AI Comprehension in Theory of ComputationPardis Sadat Zahraei, Ehsaneddin Asgari. 12267-12280 [doi]

Learning to Refine with Fine-Grained Natural Language FeedbackManya Wadhwa, Xinyu Zhao, Junyi Jessy Li, Greg Durrett. 12281-12308 [doi]

Implicit Personalization in Language Models: A Systematic StudyZhijing Jin 0001, Nils Heil, Jiarui Liu 0004, Shehzaad Dhuliawala, Yahang Qi, Bernhard Schölkopf, Rada Mihalcea, Mrinmaya Sachan. 12309-12325 [doi]

When the Misidentified Adverbial Phrase Functions as a ComplementYige Chen, Kyuwon Kim, Kyungtae Lim, Jungyeul Park, Chulwoo Park. 12326-12336 [doi]

Unveiling Implicit Table Knowledge with Question-Then-Pinpoint Reasoner for Insightful Table SummarizationKwangwook Seo, Jinyoung Yeo, Dongha Lee 0003. 12337-12362 [doi]

Few-shot Prompting for Pairwise Ranking: An Effective Non-Parametric Retrieval ModelNilanjan Sinhababu, Andrew Parry, Debasis Ganguly, Debasis Samanta, Pabitra Mitra. 12363-12377 [doi]

Self-training Language Models for Arithmetic ReasoningMarek Kadlcík, Michal Stefánik. 12378-12386 [doi]

PPTC-R benchmark: Towards Evaluating the Robustness of Large Language Models for PowerPoint Task CompletionZekai Zhang, Yiduo Guo, Yaobo Liang, Dongyan Zhao 0001, Nan Duan. 12387-12402 [doi]

Efficient Pointwise-Pairwise Learning-to-Rank for News RecommendationNithish Kannen, Yao Ma, Gerrit J. J. van den Burg, Jean Baptiste Faddoul. 12403-12418 [doi]

Fast Matrix Multiplications for Lookup Table-Quantized LLMsHan Guo, William Brandon, Radostin Cholakov, Jonathan Ragan-Kelley, Eric P. Xing, Yoon Kim. 12419-12433 [doi]

Distance-aware Calibration for Pre-trained Language ModelsAlberto Gasparin, Gianluca Detommaso. 12434-12447 [doi]

Language Models are Surprisingly Fragile to Drug Names in Biomedical BenchmarksJack Gallifant, Shan Chen, Pedro Moreira, Nikolaj Munch, Mingye Gao, Jackson Pond, Leo Anthony Celi, Hugo J. W. L. Aerts, Thomas Hartvigsen, Danielle S. Bitterman. 12448-12465 [doi]

To Err Is Human, but Llamas Can Learn It TooAgnes Luhtaru, Taido Purason, Martin Vainikko, Maksym Del, Mark Fishel. 12466-12481 [doi]

PizzaCommonSense: A Dataset for Commonsense Reasoning about Intermediate Steps in Cooking RecipesAïssatou Diallo, Antonis Bikakis, Luke Dickens, Anthony Hunter, Rob Miller 0002. 12482-12496 [doi]

Enhancing Discourse Dependency Parsing with Sentence Dependency Parsing: A Unified Generative Method Based on Code RepresentationZizhuo Shen, Yanqiu Shao, Wei Li. 12497-12507 [doi]

"Knowing When You Don't Know": A Multilingual Relevance Assessment Dataset for Robust Retrieval-Augmented GenerationNandan Thakur, Luiz Bonifacio, Crystina Zhang, Odunayo Ogundepo, Ehsan Kamalloo, David Alfonso-Hermelo, Xiaoguang Li, Qun Liu 0001, Boxing Chen, Mehdi Rezagholizadeh, Jimmy Lin. 12508-12526 [doi]

Diverse and Effective Synthetic Data Generation for Adaptable Zero-Shot Dialogue State TrackingJames D. Finch, Jinho D. Choi. 12527-12544 [doi]

Can We Instruct LLMs to Compensate for Position Bias?Meiru Zhang, Zaiqiao Meng, Nigel Collier. 12545-12556 [doi]

Textual Dataset Distillation via Language Model EmbeddingYefan Tao, Luyang Kong, Andrey Kan, Laurent Callot. 12557-12569 [doi]

TARA: Token-level Attribute Relation Adaptation for Multi-Attribute Controllable Text GenerationYilin Cao, Jiahao Zhao, Ruike Zhang, Hanyi Zou, Wenji Mao. 12570-12579 [doi]

AuriSRec: Adversarial User Intention Learning in Sequential RecommendationJunjie Zhang 0009, Ruobing Xie, Wenqi Sun, Leyu Lin, Xin Zhao 0018, Ji-Rong Wen. 12580-12592 [doi]

Denoising Rationalization for Multi-hop Fact Verification via Multi-granular ExplainerJiasheng Si, YingJie Zhu, Wenpeng Lu, Deyu Zhou. 12593-12608 [doi]

README: Bridging Medical Jargon and Lay Understanding for Patient Education through Data-Centric NLPZonghai Yao, Nandyala Siddharth Kantu, Guanghao Wei, Hieu Tran, Zhangqi Duan, Sunjae Kwon, Zhichao Yang 0001, Hong Yu 0001. 12609-12629 [doi]

Pre-trained Language Models Return Distinguishable Probability Distributions to Unfaithfully Hallucinated TextsTaehun Cha, Donghun Lee. 12630-12639 [doi]

Cognitive Bias in Decision-Making with LLMsJessica Maria Echterhoff, Yao Liu 0017, Abeer Alessa, Julian J. McAuley, Zexue He. 12640-12653 [doi]

Problem-Oriented Segmentation and Retrieval: Case Study on Tutoring ConversationsRose E. Wang, Pawan Wirawarn, Kenny Lam, Omar Khattab, Dorottya Demszky. 12654-12672 [doi]

Prompt-Based Bias Calibration for Better Zero/Few-Shot Learning of Language ModelsKang He, Yinghan Long, Kaushik Roy 0001. 12673-12691 [doi]

Can't Remember Details in Long Documents? You Need Some R&RDevanshu Agrawal, Shang Gao, Martin Gajek. 12692-12704 [doi]

HumVI: A Multilingual Dataset for Detecting Violent Incidents Impacting Humanitarian AidHemank Lamba, Anton Abilov, Ke Zhang 0013, Elizabeth M. Olson, Henry Kudzanai Dambanemuya, João Bárcia, David Batista, Christina Wille, Aoife Cahill, Joel R. Tetreault, Alejandro Jaimes. 12705-12722 [doi]

Improving Quotation Attribution with Fictional Character EmbeddingsGaspard Michel, Elena V. Epure, Romain Hennequin, Christophe Cerisara. 12723-12735 [doi]

Robust Text Classification: Analyzing Prototype-Based NetworksZhivar Sourati, Darshan Deshpande, Filip Ilievski, Kiril Gashteovski, Sascha Saralajew. 12736-12757 [doi]

GraphReader: Building Graph-based Agent to Enhance Long-Context Abilities of Large Language ModelsShilong Li, Yancheng He, Hangyu Guo, Xingyuan Bu, Ge Bai, Jie Liu 0047, Jiaheng Liu, Xingwei Qu, Yangguang Li, Wanli Ouyang, Wenbo Su, Bo Zheng 0007. 12758-12786 [doi]

Compare without Despair: Reliable Preference Evaluation with Generation SeparabilitySayan Ghosh, Tejas Srinivasan, Swabha Swayamdipta. 12787-12805 [doi]

LoRASC: Expressive and Generalizable Low-rank Adaptation for Large Models via Slow Cascaded LearningSiwei Li, Yifan Yang, Yifei Shen, Fangyun Wei, Zongqing Lu, Lili Qiu, Yuqing Yang 0001. 12806-12816 [doi]

SQFT: Low-cost Model Adaptation in Low-precision Sparse Foundation ModelsJuan Pablo Muñoz, Jinjie Yuan, Nilesh Jain. 12817-12832 [doi]

Securing Multi-turn Conversational Language Models From Distributed Backdoor AttacksTerry Tong, Qin Liu, Jiashu Xu, Muhao Chen. 12833-12846 [doi]

InternalInspector I²: Robust Confidence Estimation in LLMs through Internal StatesMohammad Beigi, Ying Shen, Runing Yang, Zihao Lin 0003, Qifan Wang, Ankith Mohan, Jianfeng He, Ming Jin 0002, Chang-Tien Lu, Lifu Huang. 12847-12865 [doi]

All You Need is Attention: Lightweight Attention-based Data Augmentation for Text ClassificationJuneHyung Kim, Sungjae Hwang. 12866-12873 [doi]

Adversarial Attacks on Parts of Speech: An Empirical Study in Text-to-Image GenerationG. M. Shahariar, Jia Chen, Jiachen Li, Yue Dong. 12874-12890 [doi]

Enhancing Alignment using Curriculum Learning & Ranked PreferencesPulkit Pattnaik, Rishabh Maheshwary, Kelechi Ogueji, Vikas Yadav, Sathwik Tejaswi Madhusudhan. 12891-12907 [doi]

Multi-Target Cross-Lingual Summarization: a novel task and a language-neutral approachDiogo Pernes, Gonçalo M. Correia, Afonso Mendes. 12908-12924 [doi]

Tab2Text - A framework for deep learning with tabular dataTong Lin 0005, Jason Yan, David Jurgens, Sabina Tomkins. 12925-12935 [doi]

More Bang for your Context: Virtual Documents for Question Answering over Long DocumentsYosi Mass, Boaz Carmeli, Asaf Yehudai, Assaf Toledo, Nathaniel Mills. 12936-12942 [doi]

Out-of-Distribution Detection through Soft Clustering with Non-Negative Kernel RegressionAryan Gulati, Xingjian Dong, Carlos Hurtado, Sarath Shekkizhar, Swabha Swayamdipta, Antonio Ortega. 12943-12959 [doi]

Synthetic Multimodal Question GenerationIan Wu, Sravan Jayanthi, Vijay Viswanathan 0002, Simon Rosenberg, Sina Pakazad, Tongshuang Wu, Graham Neubig. 12960-12993 [doi]

Lost in Translation: Chemical Language Models and the Misunderstanding of Molecule StructuresVeronika Ganeeva, Andrey Sakhovskiy, Kuzma Khrabrov, Andrey V. Savchenko, Artur Kadurin, Elena Tutubalina. 12994-13013 [doi]

HyQE: Ranking Contexts with Hypothetical Query EmbeddingsWeichao Zhou, Jiaxin Zhang, Hilaf Hasson, Anu Singh, Wenchao Li 0001. 13014-13032 [doi]

Model Merging and Safety Alignment: One Bad Model Spoils the BunchHasan Hammoud, Umberto Michieli, Fabio Pizzati, Philip Torr 0001, Adel Bibi, Bernard Ghanem, Mete Ozay. 13033-13046 [doi]

Large Language Models Are Challenged by Habitat-Centered ReasoningSadaf Ghaffari, Nikhil Krishnaswamy. 13047-13059 [doi]

How to Train Your Fact Verifier: Knowledge Transfer with Multimodal Open ModelsJaeyoung Lee, Ximing Lu, Jack Hessel, Faeze Brahman, Youngjae Yu, Yonatan Bisk, Yejin Choi 0001, Saadia Gabriel. 13060-13077 [doi]

Benchmarking Machine Translation with Cultural AwarenessBinwei Yao, Ming Jiang, Tara Bobinac, Diyi Yang, Junjie Hu. 13078-13096 [doi]

Turning English-centric LLMs Into Polyglots: How Much Multilinguality Is Needed?Tannon Kew, Florian Schottmann, Rico Sennrich. 13097-13124 [doi]

Temperature-Centric Investigation of Speculative Decoding with Knowledge DistillationSiru Ouyang, Shuohang Wang, Minhao Jiang, Ming Zhong 0005, Donghan Yu, Jiawei Han 0001, Yelong Shen. 13125-13137 [doi]

Generate then Refine: Data Augmentation for Zero-shot Intent DetectionI-Fan Lin, Faegheh Hasibi, Suzan Verberne. 13138-13146 [doi]

Unleashing the Power of Large Language Models in Zero-shot Relation Extraction via Self-PromptingSiyi Liu, Yang Li, Jiang Li, Shan Yang, Yunshi Lan. 13147-13161 [doi]

"What is the value of templates?" Rethinking Document Information Extraction Datasets for LLMsRan Zmigrod, Pranav Shetty, Mathieu Sibue, Zhiqiang Ma, Armineh Nourbakhsh, Xiaomo Liu, Manuela Veloso. 13162-13185 [doi]

What Matters in Memorizing and Recalling Facts? Multifaceted Benchmarks for Knowledge Probing in Language ModelsXin Zhao, Naoki Yoshinaga 0001, Daisuke Oba. 13186-13214 [doi]

On Leakage of Code Generation Evaluation DatasetsAlexandre Matton, Tom Sherborne, Dennis Aumiller, Elena Tommasone, Milad Alizadeh, Jingyi He, Raymond Ma, Maxime Voisin, Ellen Gilsenan-McMahon, Matthias Gallé. 13215-13223 [doi]

The Language of Trauma: Modeling Traumatic Event Descriptions Across Domains with Explainable AIMiriam Schirmer, Tobias Leemann, Gjergji Kasneci, Jürgen Pfeffer, David Jurgens. 13224-13242 [doi]

Auto-Evolve: Enhancing Large Language Model's Performance via Self-Reasoning FrameworkKrishna Aswani, Huilin Lu, Pranav Patankar, Priya Dhalwani, Xue Tan, Jayant Ganeshmohan, Simon Lacasse. 13243-13257 [doi]

V-DPO: Mitigating Hallucination in Large Vision Language Models via Vision-Guided Direct Preference OptimizationYuxi Xie, Guanzhen Li, Xiao Xu, Min-Yen Kan. 13258-13273 [doi]

Exploring the Potential of Multimodal LLM with Knowledge-Intensive Multimodal ASRMinghan Wang, Yuxia Wang, Thuy-Trang Vu, Ehsan Shareghi, Reza Haf. 13274-13288 [doi]

Better Alignment with Instruction Back-and-Forth TranslationThao Nguyen, Jeffrey Li, Sewoong Oh, Ludwig Schmidt, Jason Weston, Luke Zettlemoyer, Xian Li. 13289-13308 [doi]

AliGATr: Graph-based layout generation for form understandingArmineh Nourbakhsh, Zhao Jin, Siddharth Parekh, Sameena Shah, Carolyn P. Rosé. 13309-13328 [doi]

Attribute Controlled Fine-tuning for Large Language Models: A Case Study on DetoxificationTao Meng, Ninareh Mehrabi, Palash Goyal, Anil Ramakrishna, Aram Galstyan, Richard S. Zemel, Kai-Wei Chang, Rahul Gupta 0001, Charith Peris. 13329-13341 [doi]

SciDoc2Diagrammer-MAF: Towards Generation of Scientific Diagrams from Documents guided by Multi-Aspect Feedback RefinementIshani Mondal, Zongxia Li, Yufang Hou 0001, Anandhavelu Natarajan, Aparna Garimella, Jordan L. Boyd-Graber. 13342-13375 [doi]

TinyStyler: Efficient Few-Shot Text Style Transfer with Authorship EmbeddingsZachary Horvitz, Ajay Patel, Kanishk Singh, Chris Callison-Burch, Kathleen R. McKeown, Zhou Yu. 13376-13390 [doi]

Can LLMs Understand the Implication of Emphasized Sentences in Dialogue?Guan-Ting Lin, Hung-yi Lee. 13391-13401 [doi]

Why do LLaVA Vision-Language Models Reply to Images in English?Musashi Hinck, Carolin Holtermann, Matthew L. Olson, Florian Schneider, Sungduk Yu, Anahita Bhiwandiwalla, Anne Lauscher, Shao-Yen Tseng, Vasudev Lal. 13402-13421 [doi]

Preference Tuning For Toxicity Mitigation Generalizes Across LanguagesXiaochen Li, Zheng Xin Yong, Stephen H. Bach. 13422-13440 [doi]

Calibrating Long-form Generations From Large Language ModelsYukun Huang, Yixin Liu 0003, Raghuveer Thirukovalluru, Arman Cohan, Bhuwan Dhingra. 13441-13460 [doi]

Train Once, Deploy Anywhere: Matryoshka Representation Learning for Multimodal RecommendationYueqi Wang, Zhenrui Yue, Huimin Zeng 0001, Dong Wang 0002, Julian J. McAuley. 13461-13472 [doi]

Exploring Quantization for Efficient Pre-Training of Transformer Language ModelsKamran Chitsaz, Quentin Fournier, Gonçalo Mordido, Sarath Chandar. 13473-13487 [doi]

Multilingual Synopses of Movie Narratives: A Dataset for Vision-Language Story UnderstandingYidan Sun, Jianfei Yu, Boyang Li 0001. 13488-13504 [doi]

MVP-Bench: Can Large Vision-Language Models Conduct Multi-level Visual Perception Like Humans?Guanzhen Li, Yuxi Xie, Min-Yen Kan. 13505-13527 [doi]

Topic Modeling: Contextual Token Embeddings Are All You NeedDimo Angelov, Diana Inkpen. 13528-13539 [doi]

Dense Passage Retrieval: Is it Retrieving?Benjamin Z. Reichman, Larry Heck. 13540-13553 [doi]

Margin Matching Preference Optimization: Enhanced Model Alignment with Granular FeedbackKyuyoung Kim, Ah Jeong Seo, Hao Liu, Jinwoo Shin, Kimin Lee. 13554-13570 [doi]

AfriInstruct: Instruction Tuning of African Languages for Diverse TasksKosei Uemura, Mahe Chen, Alex Pejovic, Chika Maduabuchi, Yifei Sun, En-shiun Lee. 13571-13585 [doi]

LLMs as Collaborator: Demands-Guided Collaborative Retrieval-Augmented Generation for Commonsense Knowledge-Grounded Open-Domain Dialogue SystemsJiong Yu, Sixing Wu, Jiahao Chen, Wei Zhou. 13586-13612 [doi]

ClaimVer: Explainable Claim-Level Verification and Evidence Attribution of Text Through Knowledge GraphsPreetam Prabhu Srikar Dammu, Himanshu Naidu, Mouly Dewan, Youngmin Kim, Tanya Roosta, Aman Chadha, Chirag Shah. 13613-13627 [doi]

Empirical Prior for Text AutoencodersYongjing Yin, Wenyang Gao, Haodong Wu, Jianhao Yan, Yue Zhang 0004. 13628-13640 [doi]

Pedagogical Alignment of Large Language ModelsShashank Sonkar, Kangqi Ni, Sapana Chaudhary, Richard G. Baraniuk. 13641-13650 [doi]

Reference-based Metrics Disprove Themselves in Question GenerationBang Nguyen, Mengxia Yu, Yun Huang 0003, Meng Jiang 0001. 13651-13666 [doi]

Regression Aware Inference with LLMsMichal Lukasik, Harikrishna Narasimhan, Aditya Krishna Menon, Felix Yu, Sanjiv Kumar. 13667-13678 [doi]

R³-NL2GQL: A Model Coordination and Knowledge Graph Alignment Approach for NL2GQLYuhang Zhou, Yu He, Siyu Tian, Yuchen Ni, Zhangyue Yin, Xiang Liu, Chuanjun Ji, Sen Liu, Xipeng Qiu, Guangnan Ye, Hongfeng Chai. 13679-13692 [doi]

Updating Large Language Models' Memories with Time ConstraintsXin Wu, Yuqi Bu, Yi Cai, Tao Wang. 13693-13702 [doi]

DLoRA: Distributed Parameter-Efficient Fine-Tuning Solution for Large Language ModelChao Gao, Sai Qian Zhang. 13703-13714 [doi]

Cross-modality Information Check for Detecting Jailbreaking in Multimodal Large Language ModelsYue Xu, Xiuyuan Qi, Zhan Qin, Wenjie Wang. 13715-13726 [doi]

Attacks against Abstractive Text Summarization Models through Lead Bias and Influence FunctionsPoojitha Thota, Shirin Nilizadeh. 13727-13741 [doi]

One Model is All You Need: ByT5-Sanskrit, a Unified Model for Sanskrit NLP TasksSebastian Nehrdich, Oliver Hellwig, Kurt Keutzer. 13742-13751 [doi]

NALA: an Effective and Interpretable Entity Alignment MethodChuanhao Xu, Jingwei Cheng, Fu Zhang 0001. 13752-13772 [doi]

ConTReGen: Context-driven Tree-structured Retrieval for Open-domain Long-form Text GenerationKashob Kumar Roy, Pritom Saha Akash, Kevin Chen-Chuan Chang, Lucian Popa 0001. 13773-13784 [doi]

Aligners: Decoupling LLMs and AlignmentLilian Ngweta, Mayank Agarwal, Subha Maity, Alex Gittens, Yuekai Sun, Mikhail Yurochkin. 13785-13802 [doi]

TOWER: Tree Organized Weighting for Evaluating Complex InstructionsNoah Ziems, Zhihan Zhang, Meng Jiang 0001. 13803-13810 [doi]

Extractive Medical Entity Disambiguation with Memory Mechanism and Memorized Entity InformationGuobiao Zhang, Xueping Peng, Tao Shen 0001, Guodong Long, Jiasheng Si, Libo Qin 0001, Wenpeng Lu. 13811-13822 [doi]

QEFT: Quantization for Efficient Fine-Tuning of LLMsChanghun Lee, Jungyu Jin, Younghyun Cho, Eunhyeok Park. 13823-13837 [doi]

Skills-in-Context: Unlocking Compositionality in Large Language ModelsJiaao Chen, Xiaoman Pan, Dian Yu 0001, Kaiqiang Song, Xiaoyang Wang, Dong Yu 0001, Jianshu Chen. 13838-13890 [doi]

DrAttack: Prompt Decomposition and Reconstruction Makes Powerful LLMs JailbreakersXirui Li, Ruochen Wang, Minhao Cheng, Tianyi Zhou, Cho-Jui Hsieh. 13891-13913 [doi]

Can LLMs Replace Clinical Doctors? Exploring Bias in Disease Diagnosis by Large Language ModelsYutian Zhao, Huimin Wang, Yuqi Liu, Suhuang Wu, Xian Wu 0001, Yefeng Zheng 0001. 13914-13935 [doi]

BLADE: Benchmarking Language Model Agents for Data-Driven ScienceKen Gu, Ruoxi Shang, Ruien Jiang, Keying Kuang, Richard-John Lin, Donghe Lyu, Yue Mao, Youran Pan, Teng Wu, Jiaqian Yu, Yikun Zhang, Tianmai M. Zhang, Lanyi Zhu, Mike A. Merrill, Jeffrey Heer, Tim Althoff. 13936-13971 [doi]

Phonetic and Lexical Discovery of Canine VocalizationTheron Wang, Xingyuan Li, Chunhao Zhang, Mengyue Wu, Kenny Q. Zhu. 13972-13983 [doi]

Audio-Based Linguistic Feature Extraction for Enhancing Multi-lingual and Low-Resource Text-to-SpeechYoungjae Kim, Yejin Jeon, Gary Geunbae Lee. 13984-13989 [doi]

LexC-Gen: Generating Data for Extremely Low-Resource Languages with Large Language Models and Bilingual LexiconsZheng Xin Yong, Cristina Menghini, Stephen H. Bach. 13990-14009 [doi]

Beyond Demographics: Aligning Role-playing LLM-based Agents Using Human Belief NetworksYun-Shiuan Chuang, Krirk Nirunwiroj, Zach Studdiford, Agam Goyal, Vincent Frigo, Sijia Yang, Dhavan Shah, Junjie Hu, Timothy T. Rogers. 14010-14026 [doi]

PRoDeliberation: Parallel Robust Deliberation for End-to-End Spoken Language UnderstandingTrang Le, Daniel Lazar, Suyoun Kim, Shan Jiang, Duc Le, Adithya Sagar, Aleksandr Livshits, Ahmed Aly, Akshat Shrivastava. 14027-14038 [doi]

Downstream Trade-offs of a Family of Text WatermarksAnirudh Ajith, Sameer Singh, Danish Pruthi. 14039-14053 [doi]

Knowledge-Aware Reasoning over Multimodal Semi-structured TablesSuyash Vardhan Mathur, Jainit Sushil Bafna, Kunal Kartik, Harshita Khandelwal, Manish Shrivastava 0001, Vivek Gupta 0001, Mohit Bansal, Dan Roth. 14054-14073 [doi]

Representational Isomorphism and Alignment of Multilingual Large Language ModelsDi Wu, Yibin Lei, Andrew Yates, Christof Monz. 14074-14085 [doi]

SWAG: Storytelling With Action GuidanceJonathan Pei, Zeeshan Patel, Karim El-Refai, Tianle Li. 14086-14106 [doi]

Random Label Forests: An Ensemble Method with Label Subsampling For Extreme Multi-Label ProblemsSheng-Wei Chen 0003, Chih-Jen Lin. 14107-14119 [doi]

Active Listening: Personalized Question Generation in Open-Domain Social Conversation with User Model Based PromptingKevin Bowden, Yue Fan, Winson Chen, Wen Cui, Davan Harrison, Xin Wang, Marilyn A. Walker. 14120-14157 [doi]

Query-based Cross-Modal Projector Bolstering Mamba Multimodal LLMSooHwan Eom, Jay Shim, Gwanhyeong Koo, Haebin Na, Mark Hasegawa-Johnson, Sungwoong Kim, Chang Dong Yoo. 14158-14167 [doi]

LLM as a metric critic for low resource relation identificationZhe Yang, Yi Huang, Yaqin Chen, Xiaoting Wu, Junlan Feng, Chao Deng 0002. 14168-14178 [doi]

Experience as Source for Anticipation and Planning: Experiential Policy Learning for Target-driven Recommendation DialoguesHuy Dao, Yang Deng 0002, Khanh-Huyen Bui, Dung D. Le, Lizi Liao. 14179-14198 [doi]

Factcheck-Bench: Fine-Grained Evaluation Benchmark for Automatic Fact-checkersYuxia Wang, Revanth Gangi Reddy, Zain Muhammad Mujahid, Arnav Arora, Aleksandr Rubashevskii, Jiahui Geng, Osama Mohammed Afzal, Liangming Pan, Nadav Borenstein, Aditya Pillai, Isabelle Augenstein, Iryna Gurevych, Preslav Nakov. 14199-14230 [doi]

Open-RAG: Enhanced Retrieval Augmented Reasoning with Open-Source Large Language ModelsShayekh Bin Islam, Md Asib Rahman, K. S. M. Tozammel Hossain, Enamul Hoque, Shafiq Joty, Md Rizwan Parvez. 14231-14244 [doi]

Cactus: Towards Psychological Counseling Conversations using Cognitive Behavioral TheorySuyeon Lee, Sunghwan Kim, Minju Kim, Dongjin Kang, Dongil Yang, Harim Kim, Minseok Kang, Dayi Jung, Min-Hee Kim, Seungbeen Lee, Kyoung-Mee Chung, Youngjae Yu, Dongha Lee 0003, Jinyoung Yeo. 14245-14274 [doi]

TextLap: Customizing Language Models for Text-to-Layout PlanningJian Chen, Ruiyi Zhang, Yufan Zhou, Jennifer Healey, Jiuxiang Gu, Zhiqiang Xu, Changyou Chen. 14275-14289 [doi]

Data-driven Coreference-based Ontology BuildingShir Ashury-Tahan, Amir D. N. Cohen, Nadav Cohen, Yoram Louzoun, Yoav Goldberg. 14290-14300 [doi]

Retrieving Contextual Information for Long-Form Question Answering using Weak SupervisionPhilipp Christmann, Svitlana Vakulenko, Ionut Sorodoc, Bill Byrne, Adrià de Gispert. 14301-14310 [doi]

Persuasiveness of Generated Free-Text Rationales in Subjective Decisions: A Case Study on Pairwise Argument RankingMohamed Elaraby, Diane J. Litman, Xiang Li 0069, Ahmed Magooda. 14311-14329 [doi]

Semantic Token Reweighting for Interpretable and Controllable Text Embeddings in CLIPEunji Kim, Kyuhong Shim, Simyung Chang, Sungroh Yoon. 14330-14345 [doi]

DYNAMICQA: Tracing Internal Knowledge Conflicts in Language ModelsSara Marjanovic, Haeun Yu, Pepa Atanasova, Maria Maistro, Christina Lioma, Isabelle Augenstein. 14346-14360 [doi]

LLMs to Replace Crowdsourcing For Parallel Data Creation? The Case of Text DetoxificationDaniil Moskovskiy, Sergey Pletenev, Alexander Panchenko. 14361-14373 [doi]

Efficient Active Learning with AdaptersDaria Galimzianova, Leonid Sanochkin. 14374-14383 [doi]

How You Prompt Matters! Even Task-Oriented Constraints in Instructions Affect LLM-Generated Text DetectionRyuto Koike, Masahiro Kaneko, Naoaki Okazaki. 14384-14395 [doi]

"Seeing the Big through the Small": Can LLMs Approximate Human Judgment Distributions on NLI from a Few Explanations?Beiduo Chen, Xinpeng Wang 0003, Siyao Peng, Robert Litschko, Anna Korhonen, Barbara Plank. 14396-14419 [doi]

Language Models in Dialogue: Conversational Maxims for Human-AI InteractionsErik Miehling, Manish Nagireddy, Prasanna Sattigeri, Elizabeth Daly, David Piorkowski, John T. Richards. 14420-14437 [doi]

LLM-Based Multi-Hop Question Answering with Knowledge Graph Integration in Evolving EnvironmentsRuirui Chen 0002, Weifeng Jiang, Chengwei Qin, Ishaan Singh Rawal, Cheston Tan, Dongkyu Choi, Bo Xiong, Bo Ai. 14438-14451 [doi]

Self-supervised Preference Optimization: Enhance Your Language Model with Preference Degree AwarenessJian Li, Haojing Huang, Yujia Zhang, Pengfei Xu, Xi Chen, Rui Song 0008, Lida Shi, Jingwen Wang, Hao Xu 0012. 14452-14466 [doi]

Mitigating Hallucination in Fictional Character Role-PlayNafis Sadeq, Zhouhang Xie, Byungkyu Kang, Prarit Lamba, Xiang Gao, Julian J. McAuley. 14467-14479 [doi]

I'm sure you're a real scholar yourself: Exploring Ironic Content Generation by Large Language ModelsPier Felice Balestrucci, Silvia Casola, Soda Marem Lo, Valerio Basile, Alessandro Mazzei. 14480-14494 [doi]

Enhancing Temporal Sensitivity and Reasoning for Time-Sensitive Question AnsweringWanqi Yang, Yanda Li, Meng Fang, Ling Chen. 14495-14508 [doi]

Minimal Yet Big Impact: How AI Agent Back-channeling Enhances Conversational Engagement through Conversation Persistence and Context RichnessJin Yea Jang, Saim Shin, Gahgene Gweon. 14509-14521 [doi]

Large Language Models for Propaganda Span AnnotationMaram Hasanain, Fatema Ahmad, Firoj Alam. 14522-14532 [doi]

Style-Compress: An LLM-Based Prompt Compression Framework Considering Task-Specific StylesXiao Pu 0003, Tianxing He, Xiaojun Wan 0001. 14533-14549 [doi]

POSIX: A Prompt Sensitivity Index For Large Language ModelsAnwoy Chatterjee, H. S. V. N. S. Kowndinya Renduchintala, Sumit Bhatia, Tanmoy Chakraborty 0002. 14550-14565 [doi]

Capturing Minds, Not Just Words: Enhancing Role-Playing Language Models with Personality-Indicative DataYiting Ran, Xintao Wang, Rui Xu, Xinfeng Yuan, Jiaqing Liang, Yanghua Xiao, Deqing Yang. 14566-14576 [doi]

Local and Global Decoding in Text GenerationDaniel Gareev, Thomas Hofmann, Ezhilmathi Krishnasamy, Tiago Pimentel. 14577-14597 [doi]

LEGOBench: Scientific Leaderboard Generation BenchmarkShruti Singh, Shoaib Alam, Husain Malwat, Mayank Singh 0001. 14598-14613 [doi]

H-LegalKI: A Hierarchical Legal Knowledge Integration Framework for Legal Community Question AnsweringYue Jiang, Ziyu Guan, Jie Zhao 0013, Wei Zhao 0019, Jiaqi Yang. 14614-14625 [doi]

Identifying Factual Inconsistencies in Summaries: Grounding LLM Inference via Task TaxonomyLiyan Xu, Zhenlin Su, Mo Yu, Jin Xu, Jinho D. Choi, Jie Zhou 0016, Fei Liu. 14626-14641 [doi]

Long Sequence Modeling with Attention Tensorization: From Sequence to Tensor LearningAosong Feng, Rex Ying, Leandros Tassiulas. 14642-14655 [doi]

BanglaTLit: A Benchmark Dataset for Back-Transliteration of Romanized BanglaMd Fahim, Fariha Tanjim Shifat, Fabiha Haider, Deeparghya Dutta Barua, Md Sakib Ul Rahman Sourove, Md Farhan Ishmam, Md Bhuiyan. 14656-14672 [doi]

Finding the Optimal Byte-Pair Encoding Merge Operations for Neural Machine Translation in a Low-Resource SettingKristine Mae M. Adlaon, Nelson Marcos. 14673-14682 [doi]

Can Machines Resonate with Humans? Evaluating the Emotional and Empathic Comprehension of LMsMuhammad Arslan Manzoor, Yuxia Wang, Minghan Wang, Preslav Nakov. 14683-14701 [doi]

EU DisinfoTest: a Benchmark for Evaluating Language Models' Ability to Detect Disinformation NarrativesWitold Sosnowski, Arkadiusz Modzelewski, Kinga Skorupska, Jahna Otterbacher, Adam Wierzbicki. 14702-14723 [doi]

Adaptive BPE Tokenization for Enhanced Vocabulary Adaptation in Finetuning Pretrained Language ModelsGunjan Balde, Soumyadeep Roy, Mainack Mondal, Niloy Ganguly. 14724-14733 [doi]

From Reading to Compressing: Exploring the Multi-document Reader for Prompt CompressionEunseong Choi, Sunkyung Lee 0001, Minjin Choi 0001, June Park, Jongwuk Lee. 14734-14754 [doi]

Knowledge-Guided Dynamic Modality Attention Fusion Framework for Multimodal Sentiment AnalysisXinyu Feng, Yuming Lin, Lihua He, You Li, Liang Chang, Ya Zhou. 14755-14766 [doi]

LexMatcher: Dictionary-centric Data Curation for LLM-based Machine TranslationYongjing Yin, Jiali Zeng, Yafu Li, Fandong Meng, Yue Zhang 0004. 14767-14779 [doi]

SARCAT: Generative Span-Act Guided Response Generation using Copy-enhanced Target AugmentationJeong-Doo Lee, Hyeongjun Choi, Beomseok Hong, Youngsub Han, Byoung-Ki Jeon, Seung-Hoon Na. 14780-14787 [doi]

Does Context Help Mitigate Gender Bias in Neural Machine Translation?Harritxu Gete, Thierry Etchegoyhen. 14788-14794 [doi]

A Critical Look at Meta-evaluating Summarisation Evaluation MetricsXiang Dai, Sarvnaz Karimi, Biaoyan Fang. 14795-14808 [doi]

LLMs for Generating and Evaluating Counterfactuals: A Comprehensive StudyVan Bach Nguyen, Paul Youssef, Christin Seifert, Jörg Schlötterer. 14809-14824 [doi]

Unlocking Black-Box Prompt Tuning Efficiency via Zeroth-Order OptimizationHeshen Zhan, Congliang Chen, Tian Ding, Ziniu Li, Ruoyu Sun 0001. 14825-14838 [doi]

Unveiling Narrative Reasoning Limits of Large Language Models with Trope in Movie SynopsesHung-Ting Su, Ya-Ching Hsu, Xudong Lin 0003, Xiang Qian Shi 0002, Yulei Niu, Han-Yuan Hsu, Hung-yi Lee, Winston H. Hsu. 14839-14854 [doi]

Unveiling the Flaws: Exploring Imperfections in Synthetic Data and Mitigation Strategies for Large Language ModelsJie Chen 0007, Yupeng Zhang, Bingning Wang, Xin Zhao 0018, Ji-Rong Wen, Weipeng Chen. 14855-14865 [doi]

CED: Comparing Embedding Differences for Detecting Out-of-Distribution and Hallucinated TextHakyung Lee, Keon Hee Park, Hoyoon Byun, Jeyoon Yeom, Jihee Kim, Gyeong-Moon Park, Kyungwoo Song. 14866-14882 [doi]

CHAmbi: A New Benchmark on Chinese Ambiguity Challenges for Large Language ModelsQin Zhang, Sihan Cai, Jiaxu Zhao 0002, Mykola Pechenizkiy, Meng Fang. 14883-14898 [doi]

Analyzing Context Contributions in LLM-based Machine TranslationEmmanouil Zaranis, Nuno Guerreiro, Andre Martins. 14899-14924 [doi]

ARTS: Assessing Readability & Text SimplicityBjörn Engelmann 0002, Christin Kreutz, Fabian Haak, Philipp Schaer. 14925-14942 [doi]

AXCEL: Automated eXplainable Consistency Evaluation using LLMsP. Aditya Sreekar, Sahil Verma, Suransh Chopra, Abhishek Persad, Sarik Ghazarian, Narayanan Sadagopan. 14943-14957 [doi]

Prospector: Improving LLM Agents with Self-Asking and Trajectory RankingByoungjip Kim, Youngsoo Jang, Lajanugen Logeswaran, Geon-hyeong Kim, Yu-Jin Kim, Honglak Lee, Moontae Lee. 14958-14976 [doi]

Characterizing Text Datasets with Psycholinguistic FeaturesMarcio Monteiro, Charu Karakkaparambil James, Marius Kloft, Sophie Fellenz. 14977-14990 [doi]

Talking the Talk Does Not Entail Walking the Walk: On the Limits of Large Language Models in Lexical Entailment RecognitionCandida Maria Greco, Lucio La Cava, Andrea Tagarelli. 14991-15011 [doi]

Making Reasoning Matter: Measuring and Improving Faithfulness of Chain-of-Thought ReasoningDebjit Paul, Robert West 0001, Antoine Bosselut, Boi Faltings. 15012-15032 [doi]

Self-training Large Language Models through Knowledge DetectionWei Jie Yeo, Teddy Ferdinan, Przemyslaw Kazienko, Ranjan Satapathy, Erik Cambria. 15033-15045 [doi]

VE-KD: Vocabulary-Expansion Knowledge-Distillation for Training Smaller Domain-Specific Language ModelsPengju Gao, Tomohiro Yamasaki, Kazunori Imoto. 15046-15059 [doi]

Adaptive Contrastive Search: Uncertainty-Guided Decoding for Open-Ended Text GenerationEsteban Garces Arias, Julian Rodemann, Meimingwei Li, Christian Heumann, Matthias Aßenmacher. 15060-15080 [doi]

SSP: Self-Supervised Prompting for Cross-Lingual Transfer to Low-Resource Languages using Large Language ModelsVipul Kumar Rathore, Aniruddha Deb, Ankish Kumar Chandresh, Parag Singla, Mausam. 15081-15102 [doi]

Re-examining Sexism and Misogyny Classification with Annotator AttitudesAiqi Jiang, Nikolas Vitsakis, Tanvi Dinkar, Gavin Abercrombie, Ioannis Konstas. 15103-15125 [doi]

When "A Helpful Assistant" Is Not Really Helpful: Personas in System Prompts Do Not Improve Performances of Large Language ModelsMingqian Zheng, Jiaxin Pei, Lajanugen Logeswaran, Moontae Lee, David Jurgens. 15126-15154 [doi]

Towards Efficient Visual-Language Alignment of the Q-Former for Visual Reasoning TasksSungkyung Kim, Adam Lee, Junyoung Park, Andrew Chung, Jusang Oh, Jay Yoon Lee. 15155-15165 [doi]

Modeling Gender and Dialect Bias in Automatic Speech RecognitionCamille Harris, Chijioke Mgbahurike, Neha Kumar, Diyi Yang. 15166-15184 [doi]

Are Large Language Models Consistent over Value-laden Questions?Jared Moore, Tanvi Deshpande, Diyi Yang. 15185-15221 [doi]

xTower: A Multilingual LLM for Explaining and Correcting Translation ErrorsMarcos V. Treviso, Nuno Miguel Guerreiro, Sweta Agrawal, Ricardo Rei, José Pombal, Tânia Vaz, Helena Wu, Beatriz Silva, Daan van Stigt, André Martins. 15222-15239 [doi]

LAMBDA: Large Language Model-Based Data Augmentation for Multi-Modal Machine TranslationYusong Wang, Dongyuan Li, Jialun Shen, Yicheng Xu, Mingkun Xu, Kotaro Funakoshi, Manabu Okumura. 15240-15253 [doi]

Evaluating Differentially Private Synthetic Data Generation in High-Stakes DomainsKrithika Ramesh, Nupoor Gandhi, Pulkit Madaan, Lisa Bauer, Charith Peris, Anjalie Field. 15254-15269 [doi]

Dual Process Masking for Dialogue Act RecognitionYeo-Jin Kim, Halim Acosta, Wookhee Min, Jonathan P. Rowe, Bradford W. Mott, Snigdha Chaturvedi, James C. Lester. 15270-15283 [doi]

XC-Cache: Cross-Attending to Cached Context for Efficient LLM InferenceJoão Monteiro 0002, Étienne Marcotte, Pierre-André Noël, Valentina Zantedeschi, David Vázquez 0001, Nicolas Chapados, Christopher Pal, Perouz Taslakian. 15284-15302 [doi]

Pioneering Reliable Assessment in Text-to-Image Knowledge Editing: Leveraging a Fine-Grained Dataset and an Innovative CriterionHengrui Gu 0002, Kaixiong Zhou, Yili Wang, Ruobing Wang 0003, Xin Wang 0035. 15303-15317 [doi]

DEFT: Distribution-guided Efficient Fine-Tuning for Human AlignmentLiang Zhu, Feiteng Fang, Yuelin Bai, Longze Chen, Zhexiang Zhang, Minghuan Tan, Min Yang. 15318-15331 [doi]

Eigen Attention: Attention in Low-Rank Space for KV Cache CompressionUtkarsh Saxena, Gobinda Saha, Sakshi Choudhary, Kaushik Roy 0001. 15332-15344 [doi]

ACCEPT: Adaptive Codebook for Composite and Efficient Prompt TuningYu-Chen Lin, Wei-Hua Li, Jun-Cheng Chen, Chu-Song Chen. 15345-15358 [doi]

Beyond Perplexity: Multi-dimensional Safety Evaluation of LLM CompressionZhichao Xu, Ashim Gupta, Tao Li 0022, Oliver Bentham, Vivek Srikumar. 15359-15396 [doi]

One-to-many testing for code generation from (just) natural languageMansi Uniyal, Mukul Singh, Gust Verbruggen, Sumit Gulwani, Vu Le 0002. 15397-15402 [doi]

A Unified Framework for Model EditingAkshat Gupta, Dev Sajnani, Gopala Anumanchipalli. 15403-15418 [doi]

M3SciQA: A Multi-Modal Multi-Document Scientific QA Benchmark for Evaluating Foundation ModelsChuhan Li, Ziyao Shangguan, Yilun Zhao 0001, Deyuan Li, Yixin Liu 0003, Arman Cohan. 15419-15446 [doi]

Probing the Capacity of Language Model Agents to Operationalize Disparate Experiential Context Despite DistractionSonny George, Chris Sypherd, Dylan Cashman. 15447-15459 [doi]

Knowledge-Centric Templatic Views of DocumentsIsabel Cachola, Silviu Cucerzan, Allen Herring, Vuksan Mijovic, Erik Oveson, Sujay Kumar Jauhar. 15460-15476 [doi]

Shoes-ACOSI: A Dataset for Aspect-Based Sentiment Analysis with Implicit Opinion ExtractionJoseph Peper, Wenzhao Qiu, Ryan Bruggeman, Yi Han, Estefania Chehade, Lu Wang 0008. 15477-15490 [doi]

Socratic Human Feedback (SoHF): Expert Steering Strategies for LLM Code GenerationSubramanian Chidambaram, Li Erran Li, Min Bai, Xiaopeng Li, Kaixiang Lin, Xiong Zhou, Alex C. Williams. 15491-15502 [doi]

Large Language Models Know What To Say But Not When To SpeakMuhammad Umair, Vasanth Sarathy, Jan Peter de Ruiter. 15503-15514 [doi]

Towards Explainable Chinese Native Learner Essay Fluency Assessment: Dataset, Tasks, and MethodXinshu Shen, Hongyi Wu, Yadong Zhang, Man Lan, Xiaopeng Bai, Shaoguang Mao, Yuanbin Wu, Xinlin Zhuang, Li Cai. 15515-15528 [doi]

CoCoHD: Congress Committee Hearing DatasetArnav Hiray, Yunsong Liu, Mingxiao Song, Agam Shah, Sudheer Chava. 15529-15542 [doi]

Student Data Paradox and Curious Case of Single Student-Tutor Model: Regressive Side Effects of Training LLMs for Personalized LearningShashank Sonkar, Naiming Liu, Richard G. Baraniuk. 15543-15553 [doi]

MalAlgoQA: Pedagogical Evaluation of Counterfactual Reasoning in Large Language Models and Implications for AI in EducationShashank Sonkar, Naiming Liu, Myco Le, Richard G. Baraniuk. 15554-15567 [doi]

Sonnet or Not, Bot? Poetry Evaluation for Large Models and DatasetsMelanie Walsh, Maria Antoniak, Anna Preus. 15568-15603 [doi]

Merge to Learn: Efficiently Adding Skills to Language Models with Model MergingJacob Morrison, Noah A. Smith, Hannaneh Hajishirzi, Pang Wei Koh, Jesse Dodge, Pradeep Dasigi. 15604-15621 [doi]

To Ask LLMs about English Grammaticality, Prompt Them in a Different LanguageShabnam Behzad, Amir Zeldes, Nathan Schneider 0001. 15622-15634 [doi]

Enhancing Short-Text Topic Modeling with LLM-Driven Context Expansion and Prefix-Tuned VAEsPritom Saha Akash, Kevin Chen-Chuan Chang. 15635-15646 [doi]

Targeted Multilingual Adaptation for Low-resource Language FamiliesC. M. Downey, Terra Blevins, Dhwani Serai, Dwija Parikh, Shane Steinert-Threlkeld. 15647-15663 [doi]

A Pointer Network-based Approach for Joint Extraction and Detection of Multi-Label Multi-Class IntentsAnkan Mullick, Sombit Bose, Abhilash Nandy, Gajula Chaitanya, Pawan Goyal 0002. 15664-15680 [doi]

Cost-Performance Optimization for Processing Low-Resource Language Tasks Using Commercial LLMsArijit Nag, Animesh Mukherjee 0001, Niloy Ganguly, Soumen Chakrabarti. 15681-15701 [doi]

Advancing Vision-Language Models with Adapter Ensemble StrategiesYue Bai, Handong Zhao, Zhe Lin 0001, Ajinkya Kale, Jiuxiang Gu, Tong Yu 0001, SungChul Kim, Yun Fu 0001. 15702-15720 [doi]

Who Wrote When? Author Diarization in Social Media DiscussionsBenedikt T. Boenninghoff, Henry Hosseini, Robert M. Nickel, Dorothea Kolossa. 15721-15734 [doi]

Controlled Transformation of Text-Attributed GraphsNidhi Vakil, Hadi Amiri. 15735-15748 [doi]

Misinformation with Legal Consequences (MisLC): A New Task Towards Harnessing Societal Harm of MisinformationChu Fei Luo, Radin Shayanfar, Rohan Bhambhoria, Samuel Dahan, Xiaodan Zhu 0001. 15749-15768 [doi]

CASE: Efficient Curricular Data Pre-training for Building Assistive Psychology Expert ModelsSarthak Harne, Monjoy Narayan Choudhury, Madhav Rao, T. K. Srikanth, Seema Mehrotra, Apoorva Vashisht, Aarushi Basu, Manjit Sodhi. 15769-15778 [doi]

Explicit Inductive Inference using Large Language ModelsTianyang Liu, Tianyi Li, Liang Cheng, Mark Steedman. 15779-15786 [doi]

Less is More: Making Smaller Language Models Competent Subgraph Retrievers for Multi-hop KGQAWenyu Huang, Guancheng Zhou, Hongru Wang 0003, Pavlos Vougiouklis, Mirella Lapata, Jeff Z. Pan. 15787-15803 [doi]

Evaluating Gender Bias of LLMs in Making Morality JudgementsDivij Bajaj, Yuanyuan Lei 0001, Jonathan Tong, Ruihong Huang. 15804-15818 [doi]

A Study of Parameter Efficient Fine-tuning by Learning to Efficiently Fine-TuneTaha Ceritli, Savas Özkan, Jeongwon Min, Eunchung Noh, Cho Min, Mete Ozay. 15819-15836 [doi]

Explaining Mixtures of Sources in News ArticlesAlexander Spangher, James Youn, Matt DeButts, Nanyun Peng, Emilio Ferrara, Jonathan May. 15837-15859 [doi]

LLM generated responses to mitigate the impact of hate speechJakub Podolak, Szymon Lukasik, Pawel Balawender, Jan Ossowski, Jan Piotrowski, Katarzyna Bakowicz, Piotr Sankowski. 15860-15876 [doi]

Locally Measuring Cross-lingual Lexical Alignment: A Domain and Word Level PerspectiveTaelin Karidi, Eitan Grossman, Omri Abend. 15877-15893 [doi]

SaSR-Net: Source-Aware Semantic Representation Network for Enhancing Audio-Visual Question AnsweringTianyu Yang, Yiyang Nan, Lisen Dai, Zhenwen Liang, Yapeng Tian, Xiangliang Zhang 0001. 15894-15904 [doi]

Grounding Partially-Defined Events in Multimodal DataKate Sanders 0002, Reno Kriz, David Etter, Hannah Recknor, Alexander Martin 0006, Cameron Carpenter, Jingyang Lin, Benjamin Van Durme. 15905-15927 [doi]

How Does Quantization Affect Multilingual LLMs?Kelly Marchisio, Saurabh Dash, Hongyu Chen, Dennis Aumiller, Ahmet Üstün, Sara Hooker, Sebastian Ruder. 15928-15947 [doi]

Presentations are not always linear! GNN meets LLM for Text Document-to-Presentation Transformation with AttributionHimanshu Maheshwari, Sambaran Bandyopadhyay, Aparna Garimella, Anandhavelu Natarajan. 15948-15962 [doi]

Domain Adaptation via Prompt Learning for Alzheimer's DetectionShahla Farzana, Natalie Parde. 15963-15976 [doi]

SPINACH: SPARQL-Based Information Navigation for Challenging Real-World QuestionsShicheng Liu, Sina J. Semnani, Harold Triedman, Jialiang Xu, Isaac Dan Zhao, Monica S. Lam. 15977-16001 [doi]

Navigating Noisy Feedback: Enhancing Reinforcement Learning with Error-Prone Language ModelsMuhan Lin, Shuyang Shi, Yue Guo 0003, Behdad Chalaki, Vaishnav Tadiparthi, Ehsan Moradi-Pari, Simon Stepputtis, Joseph Campbell, Katia P. Sycara. 16002-16014 [doi]

On the Limited Generalization Capability of the Implicit Reward Model Induced by Direct Preference OptimizationYong Lin, Skyler Seto, Maartje ter Hoeve, Katherine Metcalf, Barry-John Theobald, Xuan Wang, Yizhe Zhang, Chen Huang, Tong Zhang. 16015-16026 [doi]

Gazelle: An Instruction Dataset for Arabic Writing AssistanceSamar M. Magdy, Fakhraddin Alwajih, Sang Yun Kwon, Reem Abdel-Salam, Muhammad Abdul-Mageed. 16027-16054 [doi]

Extrinsic Evaluation of Cultural Competence in Large Language ModelsShaily Bhatt, Fernando Diaz. 16055-16074 [doi]

BLASER 2.0: a metric for evaluation and quality estimation of massively multilingual speech and text translationDavid Dale, Marta R. Costa-Jussà. 16075-16085 [doi]

Multi-label Sequential Sentence Classification via Large Language ModelMengfei Lan, Lecheng Zheng, Shufan Ming, Halil Kilicoglu. 16086-16104 [doi]

Multi-trait User Simulation with Adaptive Decoding for Conversational Task AssistantsRafael Ferreira 0003, David Semedo, João Magalhães. 16105-16130 [doi]

VarBench: Robust Language Model Benchmarking Through Dynamic Variable PerturbationKun Qian 0016, Shunji Wan, Claudia Tang, Youzhi Wang, Xuanming Zhang, Maximillian Chen, Zhou Yu 0005. 16131-16161 [doi]

Gloss2Text: Sign Language Gloss translation using LLMs and Semantically Aware Label SmoothingPooya Fayyazsanavi, Antonios Anastasopoulos, Jana Kosecka. 16162-16171 [doi]

Structured Chain-of-Thought Prompting for Few-Shot Generation of Content-Grounded QA ConversationsMd. Arafat Sultan, Jatin Ganhotra, Ramón Fernandez Astudillo. 16172-16187 [doi]

Gradient Localization Improves Lifelong Pretraining of Language ModelsJared Fernandez, Yonatan Bisk, Emma Strubell. 16188-16195 [doi]

PFA-ERC: Psuedo-Future Augmented Dynamic Emotion Recognition in ConversationsTanmay Khule, Rishabh Agrawal, Apurva Narayan. 16196-16207 [doi]

Textless Speech-to-Speech Translation With Limited Parallel DataAnuj Diwan, Anirudh Srinivasan, David Harwath, Eunsol Choi. 16208-16224 [doi]

The Overlooked Repetitive Lengthening Form in Sentiment AnalysisLei Wang, Eduard Dragut. 16225-16238 [doi]

Remember This Event That Year? Assessing Temporal Information and Understanding in Large Language ModelsHimanshu Beniwal, Dishant Patel, Kowsik Nandagopan D, Hritik Ladia, Ankit Yadav, Mayank Singh 0001. 16239-16348 [doi]

Hop, skip, jump to Convergence: Dynamics of Learning Rate Transitions for Improved Training of Large Language ModelsShreyas Subramanian, Vignesh Ganapathiraman, Corey Barrett. 16349-16362 [doi]

FactAlign: Long-form Factuality Alignment of Large Language ModelsChao-Wei Huang, Yun-Nung Chen. 16363-16375 [doi]

HyperLoRA: Efficient Cross-task Generalization via Constrained Low-Rank Adapters GenerationChuancheng Lv, Lei Li 0040, Shitou Zhang, Gang Chen, Fanchao Qi, Ningyu Zhang 0001, Hai-Tao Zheng 0002. 16376-16393 [doi]

Inference and Verbalization Functions During In-Context LearningJunyi Tao, Xiaoyin Chen, Nelson Liu. 16394-16421 [doi]

Debate as Optimization: Adaptive Conformal Prediction and Diverse Retrieval for Event ExtractionSijia Wang, Lifu Huang. 16422-16435 [doi]

MiRAGeNews: Multimodal Realistic AI-Generated News DetectionRunsheng Huang, Liam Dugan, Yue Yang 0006, Chris Callison-Burch. 16436-16448 [doi]

Quantifying and Mitigating Unimodal Biases in Multimodal Large Language Models: A Causal PerspectiveMeiqi Chen 0001, Yixin Cao 0002, Yan Zhang, Chaochao Lu. 16449-16469 [doi]

Large Language Models are In-context Teachers for Knowledge ReasoningJiachen Zhao, Zonghai Yao, Zhichao Yang 0001, Hong Yu 0001. 16470-16486 [doi]

SocialGaze: Improving the Integration of Human Social Norms in Large Language ModelsAnvesh Rao Vijjini, Rakesh R. Menon, Jiayi Fu, Shashank Srivastava, Snigdha Chaturvedi. 16487-16506 [doi]

Narrative-of-Thought: Improving Temporal Reasoning of Large Language Models via Recounted NarrativesXinliang Frederick Zhang, Nicholas Beauchamp, Lu Wang 0008. 16507-16530 [doi]

Auto-Intent: Automated Intent Discovery and Self-Exploration for Large Language Model Web AgentsJaekyeom Kim, Dong Ki Kim, Lajanugen Logeswaran, Sungryull Sohn, Honglak Lee. 16531-16541 [doi]

See Detail Say Clear: Towards Brain CT Report Generation via Pathological Clue-driven Representation LearningChengxin Zheng, Junzhong Ji, Yanzhao Shi, Xiaodan Zhang, Liangqiong Qu. 16542-16552 [doi]

P-FOLIO: Evaluating and Improving Logical Reasoning with Abundant Human-Written Reasoning ChainsSimeng Han, Aaron Yu, Rui Shen, Zhenting Qi, Martin Riddell, Wenfei Zhou, Yujie Qiao, Yilun Zhao 0001, Semih Yavuz, Ye Liu 0006, Shafiq Joty, Yingbo Zhou, Caiming Xiong, Dragomir Radev, Rex Ying, Arman Cohan. 16553-16565 [doi]

TRIP NEGOTIATOR: A Travel Persona-aware Reinforced Dialogue Generation Model for Personalized Integrative Negotiation in TourismPriyanshu Priya, Desai Yasheshbhai, Ratnesh Joshi, Roshni R. Ramnani, Anutosh Maitra, Shubhashis Sengupta, Asif Ekbal. 16566-16595 [doi]

Chain of Condition: Construct, Verify and Solve Conditions for Conditional Question AnsweringJiuheng Lin, Yuxuan Lai, Yansong Feng. 16596-16611 [doi]

Two Tales of Persona in LLMs: A Survey of Role-Playing and PersonalizationYu-Min Tseng, Yu Chao Huang, Teng-Yun Hsiao, Wei-Lin Chen, Chao-Wei Huang, Yu Meng, Yun-Nung Chen. 16612-16631 [doi]

ToxiCraft: A Novel Framework for Synthetic Generation of Harmful InformationZheng Hui, Zhaoxiao Guo, Hang Zhao, Juanyong Duan, Congrui Huang. 16632-16647 [doi]

Look Who's Talking Now: Covert Channels From Biased LLMsDaniel Silva 0012, Frederic Sala, Ryan Gabrys. 16648-16658 [doi]

ValueScope: Unveiling Implicit Norms and Values via Return Potential Model of Social InteractionsChan Young Park, Shuyue Stella Li, Hayoung Jung, Svitlana Volkova, Tanushree Mitra, David Jurgens, Yulia Tsvetkov. 16659-16695 [doi]

Unraveling the Truth: Do VLMs really Understand Charts? A Deep Dive into Consistency and RobustnessSrija Mukhopadhyay, Adnan Qidwai, Aparna Garimella, Pritika Ramu, Vivek Gupta 0001, Dan Roth. 16696-16717 [doi]

Fine-Tuning Language Models on Multiple Datasets for Citation Intention ClassificationZeren Shui, Petros Karypis, Daniel S. Karls, Mingjian Wen, Saurav Manchanda, Ellad B. Tadmor, George Karypis. 16718-16732 [doi]

TransferCVLM: Transferring Cross-Modal Knowledge for Vision-Language ModelingDongha Choi, Jung-Jae Kim 0001, Hyunju Lee. 16733-16746 [doi]

Fast Streaming Transducer ASR Prototyping via Knowledge Distillation with WhisperIuliia Thorbecke, Juan Pablo Zuluaga-Gomez, Esaú Villatoro-Tello, Shashi Kumar, Pradeep Rangappa, Sergio Burdisso, Petr Motlícek, Karthik S, Aravind Ganapathiraju. 16747-16762 [doi]

Reasoning Paths Optimization: Learning to Reason and Explore From Diverse PathsYew Ken Chia, Guizhen Chen, Weiwen Xu, Anh Tuan Luu, Soujanya Poria, Lidong Bing. 16763-16780 [doi]

Uncertainty Calibration for Tool-Using Language AgentsHao Liu, Zi-Yi Dou, Yixin Wang, Nanyun Peng, Yisong Yue. 16781-16805 [doi]

Personalized Video Comment GenerationXudong Lin 0003, Ali Zare, Shiyuan Huang, Ming-Hsuan Yang, Shih-Fu Chang, Li Zhang. 16806-16820 [doi]

Solving for X and Beyond: Can Large Language Models Solve Complex Math Problems with More-Than-Two Unknowns?Kuei-Chun Kao, Ruochen Wang, Cho-Jui Hsieh. 16821-16843 [doi]

MedLogic-AQA: Enhancing Medicare Question Answering with Abstractive Models Focusing on Logical StructuresAizan Zafar, Kshitij Mishra, Asif Ekbal. 16844-16867 [doi]

EmbodiedBERT: Cognitively Informed Metaphor Detection Incorporating Sensorimotor InformationYu Li, Bo Peng, Yu-Yin Hsu, Chu-Ren Huang. 16868-16876 [doi]

PositionID: LLMs can Control Lengths, Copy and Paste with Explicit Positional AwarenessNoah Wang, Feiyu Duan, Yibo Zhang, Wangchunshu Zhou, Ke Xu 0001, Wenhao Huang, Jie Fu 0001. 16877-16915 [doi]

SedarEval: Automated Evaluation using Self-Adaptive RubricsZhiyuan Fan, Weinong Wang, Xing Wu, Debing Zhang. 16916-16930 [doi]

Towards One-to-Many Visual Question AnsweringHuishan Ji, Qingyi Si, Zheng Lin 0001, Yanan Cao, Weiping Wang 0005. 16931-16943 [doi]

Document-level Causal Relation Extraction with Knowledge-guided Binary Question AnsweringZimu Wang, Lei Xia, Wei Xjtlu, Xinya Du. 16944-16955 [doi]

Block-Diagonal Orthogonal Relation and Matrix Entity for Knowledge Graph EmbeddingYihua Zhu 0002, Hidetoshi Shimodaira. 16956-16972 [doi]

When Compression Meets Model Compression: Memory-Efficient Double Compression for Large Language ModelsWeilan Wang, Yu Mao, Dongdong Tang, Hongchao Du, Nan Guan, Chun Jason Xue. 16973-16983 [doi]

BiMediX: Bilingual Medical Mixture of Experts LLMSara Pieri, Sahal Shaji Mullappilly, Fahad Shahbaz Khan, Rao Muhammad Anwer, Salman H. Khan 0001, Timothy Baldwin, Hisham Cholakkal. 16984-17002 [doi]

Improving Adversarial Robustness in Vision-Language Models with Architecture and Prompt DesignRishika Bhagwatkar, Shravan Nayak, Pouya Bashivan, Irina Rish. 17003-17020 [doi]

Zero-Shot Fact Verification via Natural Logic and Large Language ModelsMarek Strong, Rami Aly, Andreas Vlachos 0001. 17021-17035 [doi]

Robust AI-Generated Text Detection by Restricted EmbeddingsKristian Kuznetsov, Eduard Tulchinskii, Laida Kushnareva, German Magai, Serguei Barannikov, Sergey I. Nikolenko, Irina Piontkovskaya. 17036-17055 [doi]

CROWD: Certified Robustness via Weight Distribution for Smoothed Classifiers against Backdoor AttackSiqi Sun, Procheta Sen, Wenjie Ruan. 17056-17070 [doi]

MiLoRA: Efficient Mixture of Low-Rank Adaptation for Large Language Models Fine-tuningJingfan Zhang, Yi Zhao, Dan Chen, Xing Tian, Huanran Zheng, Wei Zhu 0016. 17071-17084 [doi]

LLM Tropes: Revealing Fine-Grained Values and Opinions in Large Language ModelsDustin Wright 0001, Arnav Arora, Nadav Borenstein, Srishti Yadav, Serge J. Belongie, Isabelle Augenstein. 17085-17112 [doi]

PythonSaga: Redefining the Benchmark to Evaluate Code Generating LLMsAnkit Yadav, Himanshu Beniwal, Mayank Singh 0001. 17113-17126 [doi]

Efficient and Interpretable Grammatical Error Correction with Mixture of ExpertsMuhammad Reza Qorib, Alham Aji, Hwee Tou Ng. 17127-17138 [doi]

Dial BeInfo for Faithfulness: Improving Factuality of Information-Seeking Dialogue via Behavioural Fine-TuningEvgeniia Razumovskaia, Ivan Vulic, Pavle Markovic, Tomasz Cichy, Qian Zheng, Tsung-Hsien Wen, Pawel Budzianowski. 17139-17152 [doi]

Unified Active Retrieval for Retrieval Augmented GenerationQinyuan Cheng, Xiaonan Li, Shimin Li, Qin Zhu, Zhangyue Yin, Yunfan Shao, Linyang Li, Tianxiang Sun, Hang Yan 0001, Xipeng Qiu. 17153-17166 [doi]

Mitigating Catastrophic Forgetting in Language Transfer via Model MergingAnton Alexandrov, Veselin Raychev, Mark Mueller, Ce Zhang, Martin T. Vechev, Kristina Toutanova. 17167-17186 [doi]

ATQ: Activation Transformation forWeight-Activation Quantization of Large Language ModelsYundong Gai, Ping Li. 17187-17194 [doi]

Stochastic Fine-Tuning of Language Models Using Masked GradientsMohammad Akbar-Tajari, Mohammad Taher Pilehvar. 17195-17202 [doi]

To Know or Not To Know? Analyzing Self-Consistency of Large Language Models under AmbiguityAnastasiia Sedova, Robert Litschko, Diego Frassinelli, Benjamin Roth 0001, Barbara Plank. 17203-17217 [doi]

External Links

Cite Key

Statistics

PDF

Researchr

Findings of the Association for Computational Linguistics: EMNLP 2024, Miami, Florida, USA, November 12-16, 2024

Abstract

Table of Contents